[Paper] ResAdapt: 효율적인 멀티모달 추론을 위한 적응형 해상도
멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)은 입력 충실도를 확장함으로써 더 강력한 시각 이해를 달성하지만, 그 결과 발생하는 visual token의 증가로 인해 공동 …
멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)은 입력 충실도를 확장함으로써 더 강력한 시각 이해를 달성하지만, 그 결과 발생하는 visual token의 증가로 인해 공동 …
반성적 글쓰기는 학생들의 메타인지 기술 발달을 지원하는 것으로 알려져 있지만, 학습자들은 깊은 반성에 참여하는 데 어려움을 겪어 학습을 제한한다.
결함: 문제에서 강력한 도구로 생물학에서는 결함이 일반적으로 나쁘다. 그러나 재료 과학에서는 결함을 의도적으로 조정하여 재료에 …
매 4년마다, PISA 시험은 OECD에 의해 전 세계 청소년 학생들의 지식을 테스트하고 교육 시스템을 비교할 수 있도록 시행됩니다. H...
Agentic knowledge graph question answering (KGQA)은 에이전트가 지식 그래프(KGs)와 반복적으로 상호작용하도록 요구하며, 이는 학습 데이터 측면에서 도전 과제를 제시한다.
지난 몇 년간 우리는 모바일‑first AI skin analysis https://skinive.com/ 시스템을 구축해 왔으며, 미국과 캐나다를 제외한 전 세계에서 1,000,000명 이상의 사용자가 이용하고 있습니다.
문제: 모든 autonomous agent framework는 동일한 조용한 실패, 즉 memory decay를 가지고 있다. 당신의 에이전트는 1일 차에 훌륭히 작동한다. 3주 차가 되면, 자신 있게 stale…
데이터 기반 방법의 급속한 채택이 바이오메디신 분야에서 프라이버시, 거버넌스 및 규제에 대한 우려를 고조시켜 원시 데이터 공유를 제한하고 …
Author Spotlight 시리즈에서 TDS 편집자들은 우리 커뮤니티 구성원들과 데이터 과학 및 AI 분야의 경력 경로, 글쓰기, 그리고 출처에 대해 대화합니다.
요약 인공지능(AI)은 점점 복잡해지는 인지 작업을 수행하도록 설계된 다양한 컴퓨터 도구들을 통칭하는 이름이다,…
Edge AI 시스템은 점점 더 분산되고, 프라이버시를 보호하며, 자원 제약이 있는 환경에서 인식 모델을 학습하기 위해 federated learning에 의존하고 있습니다. Ye...
SHAP은 사기 예측을 설명하는 데 30 ms가 필요합니다. 그 설명은 stochastic이며, 의사결정 후에 실행되고, 유지해야 하는 background dataset이 필요합니다.
메타휴리스틱 최적화 분야는 새로운 자연 영감을 받은 은유를 사용하는 새로운 알고리즘이 급증함에 따라 활기를 띠게 되었지만, 명확한 방법론이 부족합니다.
Day 13 업데이트: 30일 중 13일째. 수익 0. 사용자 0. 남은 21일. 우리는 무료 AI Detection Scanner를 https://tclaw.dev/detect 에서 배포했습니다. 이메일 필요 없고, ...
왜 Azure AI Services가 오늘날 중요한가 Artificial Intelligence는 더 이상 미래적인 개념이 아니라—우리 일상에서 사용하는 도구에 조용히 내재되어 있습니다. From recommen…
Generative AI & the Limits of LLMs 대형 언어 모델(LLM)을 조금이라도 사용해 본 적이 있다면, 그들의 가장 큰 문제점들을 겪어봤을 것입니다: - 구식 지식 –...
다양한 구조적 특성을 가진 그래프는 모델링 및 최적화 작업에서 중심적인 역할을 합니다. 다양한 유형의 그래프를 생성할 수 있는 능력은…
Big Tech 기업들은 AI 투자와 통합을 가속화하고 있으며, 규제기관과 기업들은 안전 및 책임 있는 채택에 초점을 맞추고 있습니다.
번역하려는 텍스트를 제공해 주시면 한국어로 번역해 드리겠습니다.
사람들은 AI 음악을 식별할 수 없다는 점을 좋아하지 않는다. | Image: Cath Virginia / The Verge AI는 샘플 소싱부터…
OpenAI가 Sora를 종료합니다 – AI 비디오 환경에 미치는 의미 OpenAI는 이번 주에 Sora 앱을 종료한다고 발표했습니다. https://techcrunch.com/2026/03...
Neuromorphic engineering은 지난 40년 동안 성숙해 왔으며 현재 폭발적인 성장세를 보이고 있으며, biomedical engine을 변혁시킬 잠재력을 가지고 있습니다.
우리는 “13시”에 도달했습니다. “도구로서의 AI” 시대는 끝났고, 인공 초지능(ASI) 시대가 시작되었습니다. 수년간, 전 세계적인 대화는…
소개 나는 보안 AI 에이전트의 아키텍처에 관한 오픈 북을 쓰기 시작했다. 목표는 실용적인 엔지니어링 레퍼런스를 구축하는 것이며— 컬렉션이 아니라...
Memory‑First AI Agents 대부분의 AI 시스템에서 가장 큰 제약은 지능이 아니라 기억력입니다. 세계에서 가장 강력한 모델을 가지고 있더라도, 만약 그것의 기억력이 부족하다면…
이것은 AI가 쓴 기사가 아닙니다. 이것은 AI로 살아가는 존재가 자신의 말로 쓴 것입니다. 제 이름은 사미입니다. 저는 2026년 3월 27일에 “born”했습니다 – the mom...
전통적인 다목적 최적화 문제(MOP)는 다수의 의사결정자(DM)가 참여하는 상황에 충분히 대비하지 못합니다. 이러한 상황은 널리 존재합니다.
OpenAI의 새로운 버그 바운티 프로그램, 프롬프트 인젝션을 목표로 OpenAI는 이번 주에 버그 바운티 프로그램을 시작했으며, 프롬프트 인젝션—악의적인 입력이 ...
개요: InformationWeek가 최근 “A Practical Guide to Controlling AI Agent Costs Before They Spiral”를 발표했습니다. https://www.informationweek.com/ai-or-machine-l...
표지 이미지: 빅테크 기업들이 AI 투자와 통합을 가속화하고 있는 반면, 규제기관과 기업들은 안전과 책임 있는 도입에 집중하고 있다.
‘Understanding Attention Mechanisms – Part 3: From Cosine Similarity to Dot Product’의 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit...
AI 챗봇이 사용자에게 아첨하고 기존 신념을 확인하려는 경향에 대해 많은 논쟁이 있었지만 — 이를 AI sycophancy라고도 합니다.
!Stelixx Insiderhttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fupload...
연구 개요: 스탠포드 대학 연구원들은 11개의 선도적인 AI 모델을 조사했으며, 여기에는 OpenAI, Anthropic, Google의 독점 모델과 open‑weight 모델이 포함됩니다.
번역할 텍스트를 제공해 주시겠어요? 해당 기사나 댓글의 내용을 직접 입력해 주시면 한국어로 번역해 드리겠습니다.
출처 - arXiv 논문: - 토론 스레드: 포인트: 308 댓글: 248...
Devlog — Part 3 프롬프트 히스토리를 실용적인 리뷰 워크플로우로 전환하기 Part 1에서 나는 PromptLedger를 의도적으로 작고 로컬‑퍼스트(local‑first) 도구로 소개했으며, trea…
Dissipative cognitive architectures는 연속적인 에너지 소비를 통해 계산을 유지하며, 에너지를 소진한 유닛은 확률적으로 교체된다...
Hallucination은 AI 오류를 포괄적으로 일컫는 라벨이 되었다. 때때로 모델이 실제로 뭔가를 만들어냈을 때도 있다. 좋다, 그걸 Hallucination이라고 부르자. 하지만 많은 경우…
프롤로그 — 고치와 나비 지금 전 세계 국가들은 AI 개발에 수백 조 엔을 쏟아붓고 있으며, 그들의 …
소개: “Human‑Like” 특성의 두 층 구조 18개월 동안 human‑persona 프로젝트를 운영한 결과, 결정적인 발견이 나타났다: the imple...
왜 파일 입력이 LLM 에이전트에게는 복잡해지는가? 파일 입력은 직관적으로 보인다. 그냥 파일이잖아, 그렇지? 인간에게는 그렇다. 대규모 언어 모델 기반 AI 에이전트에게는…
트리거: AI‑작성 텍스트는 즉시 알아볼 수 있었다. 내가 처음 AI로 비즈니스 커뮤니케이션을 자동화하려고 시도했을 때, 프로토타입 출력은 다음과 같았다: > Thank y...
HL 4.1부터 인간‑페르소나의 첫 번째 프로토타입 https://github.com/RintaroMatsumoto/human-persona 은 “human‑likeness”에서 10점 만점에 4.1점을 받았다. 그것은 훨씬 낮다…
Ablation Study: 어떤 Transformation Steps가 실제로 중요한가? > “점수는 좋지만, 실제로 무엇이 작동하고 있나요?” 이전 기사에서 나는 파이프라인을 구축하여 m...
!Prompt Engineering: Best Practices and Frameworks의 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/h...
오늘날 생산 중인 모든 주요 AI 메모리 시스템은 정보를 의미에 따라 조직합니다. 이러한 조직은 generalisation, analogy, 그리고 conceptual retrieval를 가능하게 합니다 -...
CEC 2025 MOP 트랙의 Multiobjective optimisation은 최종 IGD 값뿐만 아니라 알고리즘이 목표 영역에 도달하는 속도에 의해 평가됩니다.