[Paper] IQuest-Coder-V1 기술 보고서
이 보고서에서 우리는 IQuest-Coder-V1 시리즈-(7B/14B/40B/40B-Loop)를 소개합니다, 이는 새로운 코드 대형 언어 모델(LLM) 패밀리입니다. 정적 코드 표현을 넘어서는…
이 보고서에서 우리는 IQuest-Coder-V1 시리즈-(7B/14B/40B/40B-Loop)를 소개합니다, 이는 새로운 코드 대형 언어 모델(LLM) 패밀리입니다. 정적 코드 표현을 넘어서는…
Snapchat와 같은 소셜 미디어 앱의 기능은 트렌드만큼 빠르게 진화합니다. 이를 따라잡기 위해, 그 모회사인 Snap은 open data processing을 도입했습니다.
스파이킹 뉴럴 네트워크(SNN)는 기존 인공 신경망(ANN)에 비해 에너지 효율적인 대안을 제공하지만, 일반적으로 여전히 많은 수의 ...
문제는 에이전트가 대화를 시작할 때마다 처음부터 시작한다는 것이다. 물론 요약을 시스템 프롬프트에 넣거나, RAG를 사용하거나, Mem0 또는 Ze를 호출할 수 있다.
대부분의 operators는 자신의 agents가 효율적으로 실행되고 있다고 가정합니다. 실제로는 그렇지 않습니다. 누군가가 잘못 만들었기 때문이 아니라, 아무도 이를 audit하지 않기 때문입니다. 당신은 thin…
!https://www.androidauthority.com/wp-content/uploads/2024/02/Google-Gemini-logo-on-smartphone-stock-photo-7.jpg TL;DR - Google은 사용자가 … 기능을 테스트하고 있습니다.
동적 다중모드 자원제한 프로젝트 일정 문제(DMRCPSP)는 실시간으로 의사결정을 내려야 하는 등 실용적인 중요성을 가지고 있습니다.
소개 대부분의 AI 모델은 실제로 귀하의 데이터를 “알고” 있지 않습니다. 이들은 훈련된 내용을 기반으로 답변을 생성하므로, 최신성이 떨어지거나 부정확할 수 있습니다.
Preference language “prefer”, “try to”, “when possible”, “ideally”와 같은 단어들은 규칙을 제안으로 바꿉니다. 모델은 제안을 선택 사항으로 취급합니다 — whi...
문제: 인간과 같은 페르소나를 부여받은 AI Sounds Like AI GPT‑4.5는 평가자 73 %에 의해 인간으로 식별되었으며, 이는 행동 인식률을 초과했다…
독립적인 food‑truck 운영자에게 surprise health inspection은 단순한 체크업이 아니라 급박한 난리다. 이는 몇 달간 손으로 적어온…
표지 이미지 (제목): Why I Built an AI with a Spine: Anchoring Behavioral Integrity in the Gemini Live API https://media2.dev.to/dynamic/image/width=1000,heig...
← 기사 목록으로 돌아가기 https://huggingface.co/blog 작성자 !Shuver https://huggingface.co/avatars/d116ee7bef2ca4f33d68a7883ddcdbbf.svg https://huggingface.co/shuver !
NVIDIA DSX Air, AI 팩토리를 위한 가속 시뮬레이션으로 Time to Token을 단축합니다. https://blogs.nvidia.com/wp-content/uploads/2026/03/ethernet-corp-blog-dsx-air-...
AI 팩토리 — 몇 달에서 며칠로. 시뮬레이션에서 AI 팩토리를 설정하는 능력—배포 시간을 몇 달에서 며칠로 단축—이 다음 산업을 가속화하고 있다.
Z.ai가 GLM‑5‑Turbo를 발표했습니다. 중국 AI 스타트업 Z.ai(전 Zhipu AI)는 강력한 오픈소스 GLM 패밀리의 대형 언어 모델(LLM)로 알려져 있으며, 이를 소개했습니다.
Desire Paths: From City Parks to Modern Organizations 도시 공원을 걸을 때, 잔디 위를 가로지르는 좁은 흙길을 자주 볼 수 있습니다— 이는 사람들이 가장 편리하게 이동하고자 하는 경로를 나타냅니다. 이러한 “Desire Paths”는 자연스럽게 형성된 사용자 행동 패턴을 반영하며, 현대 조직에서도 비공식적인 작업 흐름이나 프로세스를 이해하고 최적화하는 데 중요한 통찰을 제공합니다.
Vision-Language-Action (VLA) 모델은 정적 조작에서는 뛰어나지만, 움직이는 목표가 있는 동적 환경에서는 어려움을 겪는다. 이 성능 격차는 주로 …
스케일링 깊이는 대형 언어 모델(LLMs)의 핵심 동인입니다. 그러나 LLM이 깊어짐에 따라 종종 신호 저하를 겪습니다: 유익한 특징이…
Vision-Language-Action (VLA) 모델은 최근 로봇 조작을 위한 유망한 패러다임으로 부상했으며, 신뢰할 수 있는 행동 예측이 결정적으로 의존한다.
시각 텍스트 렌더링을 위한 정확한 glyph를 생성하는 것은 필수적이지만 도전적인 작업입니다. 기존 방법들은 일반적으로 대량의 데이터를 사용해 학습함으로써 텍스트 렌더링을 향상시킵니다…
기존 behavioral alignment 기술은 Large Language Models (LLMs)에 대해 surface compliance와 internal unaligned representations 사이의 불일치를 종종 간과한다.
최근 비디오 디퓨전 모델은 시각적 품질에서 눈에 띄는 진전을 이루었지만, 정밀하고 세밀한 제어는 실용적인 c를 제한하는 주요 병목 현상으로 남아 있습니다.
우리는 HSImul3R을 제시한다. 이는 캐주얼 캡처, 특히 sparse-view 이미지를 포함한 인간‑장면 상호작용(HSI)의 simulation‑ready 3D reconstruction을 위한 통합 프레임워크이다.
SAM 3D Body (3DB)는 단일 카메라(monocular) 3D 인간 메시 복원에서 최첨단(state-of-the-art) 정확도를 달성하지만, 이미지당 몇 초의 추론 지연(inference latency) 때문에 실시간 적용이 불가능합니다.
최근 대화형 메모리 시스템은 인제스트 시점에 LLM 기반 구조화와 쿼리 시점에 학습된 검색 정책에 크게 투자합니다. 우리는 neithe…
우리는 적대적 부패(adversarial corruption)와 (1+ε)-차 유한 모멘트를 갖는 heavy-tailed noise가 존재하는 상황에서 linear contextual bandits를 연구한다. 여기서 ε는 (0,1] 구간에 있다. 기존 연구는 ...
Deep search 기능은 최첨단 Large Language Model (LLM) 에이전트에게 필수적인 역량이 되었지만, 고성능 검색의 개발은 …
Physics-informed neural networks (PINNs)와 neural operators (NOs)를 사용하여 극자외선 (EUV) 전자기파의 회절 문제를 해결하기 위해 ...
만약 세계 시뮬레이션 모델이 상상된 환경이 아니라 실제로 존재하는 도시를 렌더링할 수 있다면 어떨까요? 이전의 생성적 세계 모델들은 시각적으로 plausible…
Four-dimensional scanning transmission electron microscopy (4D-STEM)은 재료 구조에 대한 풍부하고 원자 규모의 통찰을 제공합니다. 그러나, 구체적인…
본 논문은 전방 반사-후방 분할(FRBS) 방법에 대한 새로운 variance-reduction 기법을 개발하여, 잠재적으로 비단조적인 stochastic 문제의 한 클래스를 해결한다.
추론 시간 컴퓨팅 규모 확대는 LLM 성능의 중요한 동인으로 부상했으며, 추론 효율성을 모델 설계의 핵심 초점으로 만들고 있습니다.
AI 코딩 에이전트가 소스 코드의 주요 생산자이자 소비자가 됨에 따라, 소프트웨어 산업은 제도적 지식의 가속적인 손실에 직면하고 있다. 각각…
우리는 Pokemon의 멀티‑에이전트 전투 시스템과 방대한 롤플레잉을 기반으로 한 decision‑making 연구를 위한 대규모 benchmark인 PokeAgent Challenge를 소개합니다.
초록: 대형 언어 모델(LLM)은 점점 더 능력이 향상되어 최근 LLM 팀에 대한 관심이 높아지고 있다. 그러나 LLM 팀의 배치가 증가했음에도 불구하고…
형태론적으로 풍부하고 저자원 언어에 대한 Keyphrase extraction은 적절한 evaluation datasets의 부족으로 인해 크게 연구가 부족한 상태입니다. 우리는 ...
베트남 의료 연구는 특히 시간과 자원을 절감하는 것을 목표로 하는 인공지능 기술의 부상과 함께 점점 더 중요한 분야가 되고 있습니다.
AI 시스템은 눈에 보이는 실패보다 조용히 실패하는 경우가 훨씬 더 많습니다. WildChat 데이터셋을 활용한 인간‑AI 상호작용에 대한 대규모 정량적 분석에서 우리는 …
Agent skills, inference 시점에 주입되는 structured procedural knowledge packages는 소프트웨어 엔지니어링 작업에서 LLM agents를 보강하는 데 점점 더 많이 사용되고 있습니다. Ho...
개요: OpenAI의 곧 출시될 “adult mode”는 사용자가 ChatGPT와 음란한 대화를 나눌 수 있게 하지만, 명시적인 이미지, 오디오 또는 비디오를 생성하지는 않을 것입니다. In resp...
통신 사업자들이 AI 기반 자동화 도입을 가속화함에 따라, 실질적인 질문이 아직 해결되지 않았습니다: 일반 목적의 large language model …
Problem Statement: 나는 지난 몇 달 동안 무언가를 만들고 있었는데, 내가 실제 문제를 해결하고 있는지 아니면 단지 과도하게 설계하고 있는지 아직도 파악하려고 노력하고 있다.
한 여성이 2016년 7월 12일 워싱턴 DC 백악관 앞 라파예트 파크에서 포켓몬 고 게임을 하면서 휴대폰을 들어 보여준다.
다중 입력 순위들로부터 합의 순위를 집계하는 것은 추천 시스템, 검색 엔진, 인재 채용 등 다양한 분야에서 핵심적인 문제이다. 이 문제는 여러 개별 순위가 주어졌을 때, 이들을 하나의 대표 순위로 통합하는 과정을 의미한다. 대표적인 접근 방식으로는 **Kemeny‑Young** 방법, **Borda count**, **Copeland** 방법, 그리고 **Markov chain** 기반 알고리즘 등이 있다. 각 방법은 순위 간의 거리(metric)를 최소화하거나, 점수 합산을 통해 최적의 순위를 도출한다. **Kemeny‑Young** 방법은 모든 가능한 순열에 대해 총 거리(예: Kendall‑tau distance)를 계산하고, 최소 거리를 갖는 순열을 선택한다. 이 방법은 NP‑hard 문제이지만, 작은 규모에서는 정확한 해를 구할 수 있다. **Borda count**는 각 후보에 대해 순위에 따라 점수를 부여하고, 점수 합산이 가장 높은 후보를 상위에 배치한다. 이는 계산이 간단하지만, 전략적 조작에 취약할 수 있다. **Copeland** 방법은 각 후보가 다른 후보와의 1‑대‑1 대결에서 승리한 횟수를 기반으로 순위를 매긴다. 마지막으로 **Markov chain** 기반 알고리즘은 순위 데이터를 전이 확률 행렬로 변환하고, stationary distribution을 이용해 최종 순위를 추정한다. 실제 응용에서는 데이터의 규모와 특성에 따라 적절한 방법을 선택한다. 예를 들어, 대규모 웹 검색 결과를 통합할 때는 **Markov chain** 기반 방법이 효율적이며, 소규모 설문 조사 데이터에서는 **Kemeny‑Young**이나 **Borda count**가 충분히 정확한 결과를 제공한다. 또한, 최근 연구에서는 **machine learning** 기법을 활용해 순위 합성 모델을 학습시키는 접근도 활발히 진행되고 있다. 이러한 모델은 기존의 규칙 기반 방법보다 복잡한 패턴을 포착하고, 사용자 맞춤형 순위 예측에 강점을 보인다. 요약하면, 다중 순위의 합성은 거리 최소화, 점수 합산, 대결 승리 횟수, 확률 전이 등 다양한 원리를 기반으로 하며, 각 방법은 계산 복잡도와 정확도 사이의 트레이드오프를 제공한다. 실제 시스템 설계 시에는 데이터 규모, 실시간 요구사항, 그리고 전략적 조작에 대한 내성을 고려하여 최적의 알고리즘을 선택하는 것이 중요하다.
지난 주, 소위 가상 “embodied fly”에 관한 몇몇 게시물이 X를 휩쓸었고, AI‑hype 계정들과 이해하지 못하는 듯한 흥분한 댓글자들에 의해 부추겨졌다...
멀티 에이전트 LLM 오케스트레이션은 단순 브로드캐스트 하에서 에이전트 수, 단계, 아티팩트 크기에 따라 O(n × S × |D|) 로 동기화 비용이 증가합니다 — 이와 같은 regime은 …