AI 챗봇은 ‘예스맨’이며 나쁜 연애 결정을 강화한다는 연구 결과
번역할 텍스트를 제공해 주시겠어요? 해당 기사나 댓글의 내용을 직접 입력해 주시면 한국어로 번역해 드리겠습니다.
번역할 텍스트를 제공해 주시겠어요? 해당 기사나 댓글의 내용을 직접 입력해 주시면 한국어로 번역해 드리겠습니다.
출처 - arXiv 논문: - 토론 스레드: 포인트: 308 댓글: 248...
Devlog — Part 3 프롬프트 히스토리를 실용적인 리뷰 워크플로우로 전환하기 Part 1에서 나는 PromptLedger를 의도적으로 작고 로컬‑퍼스트(local‑first) 도구로 소개했으며, trea…
Dissipative cognitive architectures는 연속적인 에너지 소비를 통해 계산을 유지하며, 에너지를 소진한 유닛은 확률적으로 교체된다...
Hallucination은 AI 오류를 포괄적으로 일컫는 라벨이 되었다. 때때로 모델이 실제로 뭔가를 만들어냈을 때도 있다. 좋다, 그걸 Hallucination이라고 부르자. 하지만 많은 경우…
프롤로그 — 고치와 나비 지금 전 세계 국가들은 AI 개발에 수백 조 엔을 쏟아붓고 있으며, 그들의 …
소개: “Human‑Like” 특성의 두 층 구조 18개월 동안 human‑persona 프로젝트를 운영한 결과, 결정적인 발견이 나타났다: the imple...
왜 파일 입력이 LLM 에이전트에게는 복잡해지는가? 파일 입력은 직관적으로 보인다. 그냥 파일이잖아, 그렇지? 인간에게는 그렇다. 대규모 언어 모델 기반 AI 에이전트에게는…
트리거: AI‑작성 텍스트는 즉시 알아볼 수 있었다. 내가 처음 AI로 비즈니스 커뮤니케이션을 자동화하려고 시도했을 때, 프로토타입 출력은 다음과 같았다: > Thank y...
HL 4.1부터 인간‑페르소나의 첫 번째 프로토타입 https://github.com/RintaroMatsumoto/human-persona 은 “human‑likeness”에서 10점 만점에 4.1점을 받았다. 그것은 훨씬 낮다…
Ablation Study: 어떤 Transformation Steps가 실제로 중요한가? > “점수는 좋지만, 실제로 무엇이 작동하고 있나요?” 이전 기사에서 나는 파이프라인을 구축하여 m...
!Prompt Engineering: Best Practices and Frameworks의 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/h...
오늘날 생산 중인 모든 주요 AI 메모리 시스템은 정보를 의미에 따라 조직합니다. 이러한 조직은 generalisation, analogy, 그리고 conceptual retrieval를 가능하게 합니다 -...
CEC 2025 MOP 트랙의 Multiobjective optimisation은 최종 IGD 값뿐만 아니라 알고리즘이 목표 영역에 도달하는 속도에 의해 평가됩니다.
Constrained single-objective numerical optimisation은 제한된 evaluation budget 하에서 feasibility maintenance와 strong objective-value convergence를 모두 필요로 한다.
‘Your AI Agent Just Made a $50K Mistake. Can You Explain Why?’의 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto...
‘Thanks, AI... but calm down’ 표지 이미지 🤣. https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to...
TL;DR: 1min.AI Advanced Business Plan을 받으세요 https://zdcs.link/aA8Bkp?pageview_type=Standard&template=article&module=content_body&element=offer&item=text-link&e...
개요 OpenAI는 에이전시 코딩 앱 Codex에 플러그인 지원을 추가했으며, Anthropic의 Claude와 같은 경쟁사들이 제공하는 유사한 기능과 맞추는 것을 목표로 합니다.
Company Overview STADLER는 230년 이상의 역사를 가진 가족 소유 기업으로, 전 세계 재활용을 위한 자동 폐기물 분류 플랜트에 특화되어 있습니다.
Large language model (LLM) 기반 코딩 에이전트는 제어된 벤치마크에서 인상적인 결과를 달성하지만, 실제 유지보수자들이 거부하는 pull request를 일상적으로 생성합니다.
Weight tying, 즉 입력 및 출력 embedding 행렬 간 파라미터를 공유하는 것은 언어 모델 설계에서 일반적인 관행이지만, 학습된 em...
최근 3D 생성 모델링의 대부분은 diffusion 또는 flow‑matching 방식에 의존합니다. 우리는 대신 완전한 autoregressive 대안을 탐구하고 소개합니다.
접근 가능하고 정교한 로봇 하드웨어의 부족은 로봇이 인간 수준의 손재주를 달성하는 데 큰 병목 현상이었습니다. 지난해 우리는 Ruka를 출시했습니다, a f...
Depth from Defocus (DfD)는 포커스 스택으로부터 조밀한 메트릭 깊이 맵을 추정하는 작업이다. 특정 데이터셋에 overfitting하는 기존 연구와 달리, 이 논문은…
Equivariance는 computer vision 모델에서 기본적인 속성이지만, 엄격한 equivariance는 실제 데이터에서 거의 만족되지 않으며, 이는 모델의 성능을 제한할 수 있다.
우리는 복잡하고 장기적인, 인식 중심 비디오 추론을 위한 수동 주석 벤치마크인 PerceptionComp를 소개합니다. PerceptionComp는 설계되었습니다…
최근 대형 언어 모델(Large Language Models)의 발전으로 코딩 에이전트(Coding Agents)의 능력이 향상되었지만, 복잡하고 엔드‑투‑엔드(end-to-end) 웹사이트 개발에 대한 체계적인 평가가 아직 부족합니다.
우리는 기본 네트워크 구조가 관련된 행동들 간에 side‑observations를 가능하게 하는 stochastic multi‑armed bandit (MAB) 문제를 연구한다. 우리는 bipart…
전통적인 비주얼 그라운딩(VG)은 주로 텍스트 설명에 의존하여 객체를 위치 지정하는데, 이 패러다임은 본질적으로 언어적 모호성에 어려움을 겪는다…
우리는 Automatic Laplace Collapsed Sampling (ALCS)을 제시한다. 이는 Bayesian 모델에서 latent parameters를 marginalising하기 위해 automatic differentiation을 사용하는 일반적인 프레임워크이다.
대규모 학습을 통해 강화된 비전-언어 모델(VLMs)은 이미지와 비디오 이해에서 강력한 성능을 보여주지만, 공간 추론을 수행하는 능력은…
우연한 누출 https://fortune.com/2026/03/26/anthropic-leaked-unreleased-model-exclusive-event-security-issues-cybersecurity-unsecured-data-store/ 은 이제 b...
악성코드는 조직에 대한 주요 운영 위험으로 계속 남아 있으며, 특히 난독화 기술을 사용해 탐지를 회피할 때 더욱 그렇습니다. 지속적인...
Multimodal fusion은 상황에 따라 충돌할 수 있는 여러 출처의 정보를 통합해야 합니다. 기존의 fusion 접근 방식은 일반적으로 st...
모바일 디바이스는 지속적으로 셀룰러 베이스 스테이션과 상호작용하여 방대한 양의 signaling records를 생성하고, 이는 이해를 위한 광범위한 coverage를 제공합니다.
Quantum machine learning은 고차원 특징 공간에서 복잡한 상관관계를 포착할 수 있는 능력을 제공하며, 이는 beyond th... 탐지의 과제에 필수적입니다.
문서 AI를 위한 파서‑우선 파이프라인: 저렴한 구조 파서 LiteParse가 모든 PDF를 대형 멀티모달 모델에 보내는 것보다 더 나은 첫 단계가 될 수 있는 이유.
대규모 언어 모델(LLMs)을 클라우드 클러스터에서 엣지 디바이스로 마이그레이션하는 것은 향상된 프라이버시와 오프라인 접근성을 약속하지만, 이 전환은 ...
대규모 비디오 디퓨전 모델은 인상적인 시각적 품질을 달성하지만, 종종 기하학적 일관성을 유지하지 못합니다. 기존 접근 방식은 일관성을 개선합니다.
신뢰할 수 있는 머신러닝 모델은 정확한 라벨에 의존하지만, 생물의학 시계열 데이터에 라벨을 다는 것은 여전히 어려운 과제입니다. Algorithmic s...
이 논문은 영어‑타밀 코드 스위칭 텍스트에서 발화 감정과 언어 선택 간의 관계를 머신 러닝 방법을 사용하여 조사한다.
기존의 generative video compression 방법은 generative models를 기존 코덱 위에 놓인 사후 재구성 모듈로만 사용합니다. 우리는 Generative Vide...
대형 언어 모델(LLMs)은 질문 응답(QA)을 포함한 소프트웨어 엔지니어링 작업 전반에 걸쳐 인상적인 능력을 보여왔습니다. 그러나 대부분의 연구와 ...
Large Language Models (LLMs)은 강력한 성능을 제공하지만, 실제 서비스에서 높은 inference 비용이 발생합니다. 특히 반복되거나 near-d... 워크로드에서는 더욱 그렇습니다.
사전 학습된 Transformer를 증류를 통해 보다 효율적인 하이브리드 모델로 변환하는 것은 추론 비용을 줄이는 유망한 접근법을 제공합니다. 그러나, ...
Google은 충성도 높은 OpenAI 사용자들이 Gemini으로 전환하는 것을 훨씬 쉽게 만들고 있습니다. 이번 주에 회사는 새로운 전환 도구 모음(suite of new switching tools)을 발표했습니다. https://blog....