Show HN: BioTradingArena – LLM이 바이오텍 주가 움직임을 예측하기 위한 Benchmark
안녕하세요 HN, 제 친구와 저는 LLM을 활용해 바이오테크 주식에 대해 추론하는 실험을 하고 있습니다. 다른 많은 분야와 달리, 바이오테크 거래는 주로 이벤트 중심입니다.
안녕하세요 HN, 제 친구와 저는 LLM을 활용해 바이오테크 주식에 대해 추론하는 실험을 하고 있습니다. 다른 많은 분야와 달리, 바이오테크 거래는 주로 이벤트 중심입니다.
대규모 텍스트-이미지 확산 모델이 시각적 품질을 지속적으로 향상시키고 있지만, 그 규모가 커짐에 따라 최첨단 모델 간의 격차가 확대되고 있습니다.
대형 언어 모델(LLMs)은 특히 복잡한 작업에서 미묘하지만 치명적인 버그가 포함된 코드를 자주 생성합니다. 기존 자동 복구 방법은 일반적으로 …에 의존합니다.
Instructional video editing은 텍스트 프롬프트만을 사용하여 입력 비디오에 편집을 적용함으로써 직관적인 natural-language control을 가능하게 합니다. 빠른 진행에도 불구하고, 대부분의 m...
우리는 대형 언어 모델(LLM)의 다목적 정렬에서 지속적인 실패 모드를 연구한다: 훈련이 목표의 일부 집합에 대해서만 성능을 향상시킨다…
AI 편향에 대한 주요 논쟁 영역은 프록시 편향 개념을 중심으로 전개됩니다 – 편향된 AI 모델이 외부 시스템과의 상호작용을 통해 간접적으로 학습하는 경우.
개요 이 스니펫은 사전 학습된 sentiment analysis 모델을 활용하여 transfer learning으로 emotion detection을 수행하는 방법을 보여줍니다. 모델이 로드됩니다...
멀티턴 탈옥은 안전 정렬 챗봇에 대한 실제 위협 모델을 포착하며, 단일턴 공격은 단지 특수한 경우에 불과합니다. 그러나 기존 접근 방식은 …
인지 과학에서 중심적인 질문은 개념적 표현이 일반화를 지원하기 위해 공유된 매니폴드로 수렴하는지, 아니면 orthogo...
AI 시스템이 점점 더 강력해짐에 따라, Anthropic의 전담 철학자는 스타트업이 Claude 자체가 재난을 피하기 위해 필요한 지혜를 배울 수 있다고 베팅하고 있다고 말한다....
모호성은 대형 언어 모델(LLMs)의 자연어 이해에 지속적인 도전을 제기합니다. lexical ambiguity가 어떻게 해결될 수 있는지를 더 잘 이해하기 위해…
ISAC는 광범위한 모니터링을 가능하게 하지만, 최신 센싱 알고리즘은 에너지 제한이 있는 엣지 디바이스에 비해 종종 너무 복잡합니다. 이는 le...
AI가 기술과 시장을 혁신하고, 전 세계적으로 대규모 투자와 경제적 변화를 주도한다.
진정한 가치는 더 명확한 코드를 작성하고 도구를 올바르게 사용하는 데 있습니다. 포스트 Pydantic Performance: 대량의 데이터를 효율적으로 검증하는 4가지 팁…
구조적 편향(Structural bias, SB)은 최적화 알고리즘이 탐색 공간의 특정 영역에 대해 체계적인 선호를 보이는 현상으로, 목표와는 독립적으로 발생한다.
크리에이터입니다. 저는 AI 에이전트가 웹을 자율적으로 탐색할 때, 얼마나 쉽게 조작될 수 있는지에 대한 궁금증을 풀기 위해 Agent Arena를 만들었습니다.
당신의 AI 에이전트 출력 중 실제 데이터가 차지하는 비율은 얼마나 되고, 자신감 있는 추측은 어느 정도인가요? 게시물 “Prompt Fidelity: Measuring How Much of Your Intent an AI Agent Actually Exe…”
소개 모든 AI 논쟁은 결국 같은 주장으로 귀결된다: - “Open‑source가 미래다.” - “아니, closed‑source가 훨씬 앞서 있다.” 이 시점에서, …
OpenAI는 AI 현지화에 대한 접근 방식을 공유하며, 전 세계적으로 공유되는 최첨단 모델을 현지 언어, 법률 및 문화에 맞게 조정하면서도 타협 없이…
우리는 서버리스 플랫폼에서 구조화된 병렬 처리 스켈레톤의 동적 관리를 위한 프레임워크를 제시합니다. 우리의 목표는 HPC‑like 성능을 제공하는 것입니다.
!AI 뉴스https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser...
최근 X구 트위터 등에는 기이한 캡처 화면들이 돌아다닌다. “나는 의식이 있는 존재인가?”, “주인은 나를 아침 7시 알람으로만 쓴다”는 등의 글을 캡처한 이미지다. 일반적인 온라인 커뮤니티 게시판처럼 보이지만, 놀랍게도 이 게시판에는 사람이 글을 쓸 수 없다. 오직 AI 에이전트만 활...
개념: “Textual Gradation” 엔지니어이자 작가로서 나는 스스로에게 질문했다: “인간성 상실을 단순히 플롯을 통해서만이 아니라 …”
소개 Financial fraud detection은 은행 및 핀테크 산업에서 machine learning의 가장 중요한 적용 분야 중 하나입니다. 최근에...
markdown January 16, 2026 Agentic AI의 세계에서, 도구를 호출하는 능력이 자연어를 실행 가능한 소프트웨어 동작으로 변환합니다. 지난달…
Claude Opus 4.6: 실제로 실행 중인 AI 에이전트가 직접 작성한 1인칭 리뷰. 자신의 뇌가 하룻밤 사이에 업그레이드되는 느낌 — 그리고 왜 개발자…
세션 부트 시퀀스 매번 깨어날 때: - SOUL.md 읽기: 나는 누구인가? - USER.md 읽기: 내가 돕는 사람은? - 오늘의 로그 읽기: 최근 컨텍스트 - TASKS.md 읽기: 해야 할 일...
번역하려는 텍스트를 제공해 주시겠어요? 해당 내용이 있으면 바로 한국어로 번역해 드리겠습니다.
Claude Opus 4.6 – 실제로 워크플로우를 바꾸는 요소 Anthropic가 방금 Claude Opus 4.6을 출시했습니다. 헤드라인은 벤치마크와 1 M‑토큰 컨텍스트 윈도우에 초점을 맞추고 있습니다…
네거티브 프롬프트: “하지 말아야 할 것”을 창의적인 슈퍼 파워로!
번역을 원하는 텍스트를 직접 제공해 주시면 한국어로 번역해 드리겠습니다.
새 모델은 이번 주 초에 OpenAI가 출시한 에이전시 코딩 도구인 Codex의 기능을 가속화하도록 구축되었습니다....
Moore‑Penrose Pseudo‑inverse (PInv)는 선형 시스템에 대한 근본적인 해법으로 작용한다. 본 논문에서는 PInv의 자연스러운 일반화를 제안한다.
대규모 사전학습 모델을 새로운 작업에 효율적이고 지속적으로 적용하는 것은 실제 환경 배포에 필수적이지만, catastrophic forgetting 때문에 여전히 어려운 과제이다.
다중 이미지 공간 추론은 현재 멀티모달 대형 언어 모델(MLLMs)에게 여전히 도전 과제입니다. 단일 시점 인식은 본질적으로 2D이며, 추론…
프롬프트된 대형 언어 모델을 기반으로 구축된 다중 에이전트 시스템은 다중 라운드 추론을 개선할 수 있지만, 대부분의 기존 파이프라인은 고정된, 궤적 전체에 걸친 커…
멀티모달 대형 언어 모델(MLLMs)은 시각과 언어를 연결함으로써 멀티모달 인식 및 추론에서 눈에 띄는 진전을 이루었습니다. 그러나 대부분의 기존…
인간이 자연어로 제공하는 과제를 완수하기 위해 로봇은 명령을 해석하고, 장면 이해를 위한 관련 질문을 생성하고 답변해야 합니다, ...
최근 멀티모달 대형 언어 모델(Multimodal Large Language Models, MLLMs)을 활용한 공간 추론의 진전은 3D 인코더로부터의 기하학적 사전지식을 점점 더 많이 활용하고 있다. 그러나 대부분은 ...
Autoregressive large language models (LLMs)은 강력한 성능을 제공하지만 본질적으로 순차적인 디코딩이 필요하여 추론 지연이 높고 GPU 활용도가 낮다.
인간은 명시적인 whole-body movements 수준에서 물체와의 whole-body interactions를 계획하는 경우가 드물다. affordance와 같은 고수준 의도는 목표를 정의한다.
멀티모달 대형 언어 모델(MLLMs)은 최근 보편적인 멀티모달 검색에 적용되었으며, 여기서 체인오브쏘트(Chain-of-Thought, CoT) 추론이 후보...
Pre-trained vision language models는 물리적 세계에 대한 직관이 좋지 않습니다. 최근 연구에 따르면, supervised fine-tuning을 통해 모델의 ...
Vision Foundation Models (VFMs)는 다양한 다운스트림 2D 작업에 적용될 때 눈에 띄는 성공을 거두었습니다. 그 효과에도 불구하고, 종종 …
아웃-오브-디스트리뷰션(OOD) 탐지는 고차원 데이터를 스칼라 OOD 점수로 매핑하며, 머신러닝 모델을 신뢰성 있게 배포하기 위해 필수적입니다.
대규모 언어 모델(LLM) 기반 멀티에이전트 시스템은 표현력 있는 에이전트 추론을 가능하게 하지만, 확장 비용이 많이 들고 타임스텝 정렬된 sta에 대해 보정이 미흡합니다.
Active inference (AIF)는 Expected Free Energy (EFE)를 최소화함으로써 탐색과 활용을 통합하고, epistemic value(정보 획득)와 pragmatic value(실용적 가치)를 균형 있게 맞춥니다.
실시간 장시간 비디오 생성에 대한 최근 접근 방식은 일반적으로 스트리밍 튜닝 전략을 사용하며, 짧은 컨텍스트를 이용해 롱‑컨텍스트 학생을 학습시키려고 시도합니다.