버그를 활용하라, 모델 버그는 제외
Harness 버그, 모델 버그가 아닌 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fraw.gith...
Harness 버그, 모델 버그가 아닌 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fraw.gith...
초록: 자연어 텍스트로 훈련된 언어 모델은 T = 2, 5, 10이라는 우세한 주기를 갖는 주기적 특징을 이용해 숫자를 표현하는 방법을 학습한다. 이 논문에서 우리는 …
최근 large language models의 발전으로 수학적 추론을 포함한 다양한 작업에서 상당한 향상이 이루어졌으며, 이는 평가에 사용됩니다.
우리는 의료 영상에 대한 deep networks가 인간이 해석할 수 없고 매우 취약한 predictive input patterns와 같은 유용한 nonrobust features를 학습하는지 연구한다.
OpenClaw와 같은 자율 에이전트 시스템은 긴 컨텍스트 입력과 다중 턴 추론으로 인해 상당한 효율성 문제를 야기합니다. 이는 prohi...
배경: 2026년 4월 21일, Anthropic는 $20 Pro 플랜에서 Claude Code를 조용히 제거했습니다—이메일도, 발표도, changelog도 없었습니다. pricing page가 변경되었습니다.
초록: 짧은 시간 척도에서 나타났다 사라지는 일시적인 별과 같은 점 광원들이 스푸트니크 발사 이전의 천문 이미지에 기술되어 있다. 우리는 ...
대형 언어 모델(LLMs)은 추론을 잘하지만, 길고 잡음이 많은 문맥에 묻혀 있을 때 결정적인 증거를 놓치는 경우가 종종 있습니다. 우리는 HiLight, Evidence Emph...
개요: 중국 AI 연구소 DeepSeek는 최신 대형 언어 모델인 DeepSeek V4의 두 가지 프리뷰 버전을 출시했습니다. https://huggingface.co/collections/deepseek-a...
중국 AI 기업 DeepSeek가 금요일에 많이 기대되는 차세대 AI 모델 V4의 미리보기를 공개했으며, 이 오픈소스 모델이 경쟁할 수 있다고 말했습니다.
바이럴 레드카펫 순간이 잘생긴 인스타그램 인플루언서 그룹과, 그들이 실제가 아니라는 사실을 신경 쓰지 않을 정도로 성욕이 넘치는 팔로워들을 비추었다.
LLM 애플리케이션을 구축하는 대부분의 팀은 프롬프트 인젝션에 대해 생각합니다. 사용자들이 민감한 개인 데이터를 모델에 전송할 때 발생하는 일을 고려하는 팀은 훨씬 적습니다. 그것은...
한국 경찰, 도망친 늑대의 AI 사진을 게시한 남성을 체포! 교차로 근처 도로를 따라 걷는 늑대의 뒤쪽 모습 https://ichef.bbci.co.uk/news/4...
개발자들은 단축키를 좋아합니다. 하지만 일부 단축키는 빌드 시간을 단축할 뿐만 아니라 신뢰 경계까지 무너뜨립니다. 새로운 프록시 도구가 유포되고 있으며, 이는 여러분이 poi...
기사 URL: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro 댓글 URL: https://news.ycombinator.com/item?id=47885014 점수: 134 댓글: 11…
!EPA 마이클 크라티오스, 백악관 기술 담당 이사 겸 고문, 마이크에 대고 연단에 서서 검은색 정장 재킷과 흰색 드레스 셔츠를 입고…
텍스트 생성 • 158B • 약 5시간 전 업데이트 • 23 • 536 /deepseek-ai/DeepSeek-V4-Flash
몇 주 동안 개발자와 AI 파워 유저들은 Anthropic의 대표 모델들이 경쟁력을 잃고 있다고 보고했습니다. GitHub, X, Reddit 전역에서 커뮤니티는 …
개요 OpenAI는 오늘 새로운 GPT‑5.5 모델을 출시했으며, 이를 “지금까지 가장 똑똑하고 사용하기 가장 직관적인 모델이며, 새로운 방식으로 나아가는 다음 단계”라고 설명했습니다.
서버리스 플랫폼에서의 연합 학습(Federated learning, FL) 집계는 확고한 확장성 한계에 직면한다: 기존 아키텍처(lambda-FL, LIFL)는 클라이언트를 …
Noscroll: 당신의 Doom‑Scrolling 아웃소싱 당신이 Doom‑Scrolling을 아웃소싱할 수 있다면 어떨까요? 그것이 새로운 스타트업 Noscroll의 전제입니다. https://noscroll.c...
개요: OpenAI는 ChatGPT가 m...을 받고 있다고 발표했습니다.
AI 에이전트는 개발자 워크플로우에 혁신을 일으켰으며, 그 다음 경계는 지식 작업이다: 정보를 처리하고, 복잡한 문제를 해결하며, 새로운 i...
OpenAI는 목요일에 GPT‑5.5(https://openai.com/index/introducing-gpt-5-5/)를 출시했습니다. 이는 회사가 “가장 똑똑하고 직관적인”이라고 부르는 최신 AI 모델입니다.
출시 개요 OpenAI는 목요일에 최신 AI 모델인 GPT‑5.5(https://openai.com/index/introducing-gpt-5-5/)를 발표했으며, 회사는 이를 “가장 스마트한 …”이라고 부르고 있습니다.
!https://9to5mac.com/wp-content/uploads/sites/6/2026/02/chatgpt-app-icon-light.jpg?quality=82&strip=all&w=1600 OpenAI는 바쁜 발표 주를 마무리하고 있습니다...
멀티태스크 최적화는 다수의 작업을 병렬로 해결하는 강력한 접근법이다. 그러나 기존 알고리즘은 뚜렷한 제한에 직면한다: Populati...
소개 Agentic AI의 부상: 정의, 프레임워크 및 과제에 대한 검토 2025년은 AI가 반응형 어시스턴트에서 자율적인 … 로 이동하고 있음을 탐구한다.
개요 OpenAI는 새로운 GPT‑5.5 모델을 발표했으며, 이를 “지금까지 가장 스마트하고 직관적인 사용 모델”이자 “새로운 방식의 ...에 대한 다음 단계”라고 설명했습니다.
비디오가 빨라졌는지 느려졌는지 어떻게 알 수 있을까? 어떻게 하면 다양한 속도의 비디오를 생성할 수 있을까? 비디오는 현대 커뮤니케이션의 중심에 있었지만…
Streaming Continual Learning (CL)은 일반적으로 연속적인 스트림을 시간적 분할을 통해 이산 작업의 시퀀스로 변환합니다. 우리는 이 …
자동 음성 인식(ASR)은 전통적으로 의미에 민감하지 않은 지표인 Word Error Rate(WER)를 사용해 평가됩니다. 임베딩 기반 의미 메트릭...
Continual learning (CL)은 모델이 순차적으로 작업을 습득하면서 이전에 학습한 지식을 유지하는 방법을 연구한다. 벤치마킹에서 상당한 진전이 있음에도 불구하고...
인간 활동과 그 주변 환경을 이해하는 데는 일반적으로 visual perception에 의존하지만, 카메라는 프라이버시와 안전 측면에서 지속적인 문제를 제기한다.
우리는 배치 설정에서 다중 보정(multicalibration)의 최소‑최대(minimax) 샘플 복잡성을 연구한다. 학습자는 알려지지 않은 분포로부터 n개의 i.i.d. 샘플을 관찰하고, 출력을 해야 한다.
우리는 텍스트, 이미지, 비디오, 3D geometry, hidden representations 등 다양한 모달리티에 대해 원시적으로 학습된 통합 멀티모달 모델인 Omni를 제시한다. 우리는 ...
최첨단 언어 모델(frontier language models)이 정적 수학 벤치마크(static mathematical benchmarks)에서 거의 최고 수준의 성능을 달성함에 따라, 기존 평가들은 점점 더 모델을 구별하기 어려워지고 있다.
우리는 Vista4D를 소개한다. 이는 입력 비디오와 목표 카메라를 4D 포인트 클라우드에 기반을 두는 견고하고 유연한 video reshooting 프레임워크이다. 구체적으로, 주어진…
대규모 비전-언어 모델(LVLMs)의 능력이 인상적으로 향상되었음에도 불구하고, 이러한 시스템은 여전히 hallucinations에 취약합니다, 즉 ...
Scientific workflow systems는 execution—scheduling, fault tolerance, resource management—을 자동화하지만, 그 앞에 있는 semantic translation은 자동화하지 않습니다. Scienti...
인간과 최신 vision models는 비슷한 classification accuracy에 도달할 수 있지만, 체계적으로 다른 종류의 실수를 저지릅니다—실수가 발생하는 빈도는 다르지 않고…
Low-rank adaptation (LoRA)는 파라미터 효율적인 파인튜닝(PEFT)의 사실상 표준으로 부상했으며, 기반 모델의 적응을 가능하게 합니다.
최근 몇 년간 이미지 생성과 생성된 이미지 탐지 모두에서 상당한 진전이 이루어졌습니다. 그들의 빠른, 그러나 대체로 독립적인 개발에도 불구하고…
딥러닝 비디오 초해상도는 빠르게 발전했지만, 기후 분야에서는 일반적으로 공간이나 시간 중 하나만 초해상도(해상도 증가)를 적용하며, 그리고 …
모델 규모가 계속 커짐에 따라, 파라미터 효율적인 파인튜닝이 전체 파인튜닝에 대한 강력한 대안으로 부상했습니다. LoRA가 널리 채택되는 동안…
입법 행동(legislative behavior) 분석은 종종 투표 기록(voting records)에 의존하여 정치 연설(political speech)의 풍부한 의미적(semantic) 및 수사적(rhetorical) 내용을 간과한다. 이 논문에서 우리는 …
이 논문은 AI 게임 프로그래밍을 위한 새로운 패러다임을 제시하며, large language models (LLMs)을 활용해 Claude Shannon의 taxonomy를 확장하고 실용화합니다.
지리적 맥락은 종종 자동차 보험 위험과 관련이 있다고 여겨지지만, 공공 보험계리 데이터셋은 제한된 위치 식별자를 제공하여 이를 제약합니다.