EUNO.NEWS — Page 49

정렬:

1주 전 · ai · - · -

[Paper] LLM 판사 신뢰성 진단: Conformal Prediction Sets와 Transitivity Violations

LLM-as-judge 프레임워크는 자동 NLG 평가에 점점 더 많이 사용되고 있지만, 개별 인스턴스에 대한 신뢰성은 아직 충분히 이해되지 않고 있습니다. 우리는 두 갈래 접근법을 제시합니다.

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 잠재적 사고를 생각하라: Gloss-Free 수화 번역을 위한 새로운 패러다임

많은 SLT 시스템은 짧은 수화 조각이 구어 단어에 직접 매핑된다고 조용히 가정합니다. 그 가정은 수화 사용자가 종종 의미를…

#research #paper #ai #computer-vision
1주 전 · ai · - · -

[Paper] AnimationBench: 비디오 모델은 캐릭터 중심 애니메이션에 능숙한가?

비디오 생성은 빠르게 발전했으며, 최근 방법들은 점점 더 설득력 있는 애니메이션 결과물을 만들어내고 있습니다. 그러나 기존 벤치마크는 주로 ...에 맞춰 설계되었습니다.

#research #paper #ai #computer-vision
1주 전 · ai · - · -

[Paper] 테이블 딥러닝에서 MLP용 옵티마이저 벤치마킹

MLP는 테이블형 데이터에 대한 감독 학습을 위한 현대 딥러닝(DL) 아키텍처에서 널리 사용되는 백본이며, AdamW는 모델을 학습시키는 데 사용되는 대표적인 옵티마이저입니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] LLMs와 VLMs는 시각 없이 시점 회전을 어떻게 이해할까? Interpretability Study

지난 1년 동안, spatial intelligence는 점점 더 많은 관심을 끌고 있습니다. 많은 기존 연구들은 visual‑spatial intelligence의 관점에서 이를 연구했으며, 여기서 mo...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] SVM의 절단된 직교 다항식 커널을 이용한 구조적 해석 가능성

우리는 절단된 직교 다항식 커널로 구축된 서포트 벡터 머신(SVM)들의 사후 훈련 해석 가능성을 연구한다. 연관된 재현…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] GlobalSplat: 효율적인 피드포워드 3D Gaussian Splatting via Global Scene Tokens

프리미티브의 효율적인 공간 할당은 3D Gaussian Splatting의 기반이 되며, 이는 표현 구성 요소 간의 시너지를 직접 결정합니다.

#research #paper #ai #computer-vision
1주 전 · it · - · -

우크라이나 전쟁이 Metro 2039의 개발 및 스토리에 미친 깊은 영향

Metro Exodus가 우리를 놀라게 한 지 이제 7년이 지났습니다 https://arstechnica.com/gaming/2019/02/metro-exodus-a-good-single-player-game-to-usher-in-the-pc-ray-t...

#it #tech-news #science
1주 전 · ai · - · -

[Paper] R3D: 3D 정책 학습 재검토

3D policy learning은 우수한 일반화와 cross-embodiment transfer를 약속하지만, 훈련 불안정성과 심각한 overfitting으로 인해 진전이 방해받고 있다.

#research #paper #ai #computer-vision
1주 전 · ai · - · -

[Paper] 왜 Vision Language Models는 인간 감정을 인식하는 데 어려움을 겪을까?

감정을 이해하는 것은 지능형 시스템이 인간과 상호작용할 수 있는 기본적인 능력입니다. Vision-language models (VLMs)는 엄청난 p...

#research #paper #ai #machine-learning #computer-vision
1주 전 · devops · - · -

[Paper] 하이브리드 HPC‑양자 시스템에서 회로 절단을 위한 Wave-Based Dispatch

Hybrid High-performance Computing (HPC)-quantum 워크로드는 circuit cutting을 기반으로 large quantum circuits를 independent fragments로 분해하지만, 기존의 …

#research #paper #devops
1주 전 · software · - · -

깊이 통합된 플랫폼을 일관되게 유지하기 — 최고 아키텍트실 내부

우리 Engineering Energizers Q&A 시리즈에서는 Salesforce 전반에 걸쳐 혁신을 이끄는 엔지니어링 인재들을 조명합니다. Technology & Product Chief인 Emin Gerba를 만나보세요.

#Salesforce #platform architecture #chief architect #software engineering #cloud architecture #product strategy
1주 전 · ai · - · -

[Paper] 임베딩이 그래프 신경망을 형성하는 방식: 고전 vs 양자 지향 노드 표현

Node embeddings는 graph neural networks의 정보 인터페이스 역할을 하지만, 그들의 실증적 영향은 종종 일치하지 않는 backbones, splits, 그리고 …에 대해 보고됩니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Prism: 텐서 프로그램의 심볼릭 슈퍼옵티마이제이션

이 논문은 텐서 프로그램을 위한 최초의 심볼릭 슈퍼옵티마이저인 Prism을 소개한다. 핵심 아이디어는 sGraph이며, 이는 심볼릭하고 계층적인 표현으로서 압축적으로…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] SegWithU: 불확실성을 교란 에너지로 활용한 단일 순전파 위험 인식 의료 영상 분할

신뢰할 수 있는 uncertainty estimation은 의료 영상 분할에서 매우 중요합니다. 여기서 automated contours는 downstream quantification 및 clinical decision support에 활용됩니다.

#research #paper #ai #machine-learning #computer-vision
1주 전 · software · - · -

[Paper] 대규모 언어 모델을 Retrieval Augmented Generation으로 강화하여 소프트웨어 테스트 및 검사 자동화

본 논문에서는 소프트웨어 개발 라이프사이클(SDLC)에서 널리 사용되는 검증 및 검증(Verification and Validation, V&V) 활동 중 두 가지를 자동화하는 데 초점을 맞춥니다: Soft...

#research #paper #software
1주 전 · software · - · -

TorchTPU: 구글 규모에서 TPU에서 PyTorch를 네이티브로 실행

TorchTPU는 Google의 TPU 인프라에서 PyTorch 워크로드를 실행하기 위한 네이티브하고 고성능의 경험을 제공하도록 설계된 새로운 엔지니어링 스택입니다…

#software #google #developers
1주 전 · ai · - · -

[Paper] 클로닝은 Stabilizer 상태에 대한 학습만큼 어렵다

비직교 상태(non-orthogonal states)를 동시에 복제할 수 없다는 불가능성은 양자 이론(quantum theory)의 기초에 놓여 있다. 근사 오차(approximation errors)를 허용하더라도, 복제(cloning)…

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] CoopEval: 사회 딜레마에서 협력 유지 메커니즘 및 LLM 에이전트 벤치마킹

LLM 에이전트가 다른 목표 추구 에이전트와 효과적이고 안전하게 상호작용하는 것이 점점 더 중요해지고 있지만, 최근 연구들은 반대 추세를 보고하고 있다: LLMs ...

#research #paper #ai #machine-learning #nlp
1주 전 · software · - · -

내 노트북에서 실행한 Qwen3.6-35B-A3B가 Claude Opus 4.7보다 더 나은 펠리컨을 그려줬다

2026년 4월 16일 내 pelican riding a bicycle benchmark https://simonwillison.net/tags/pelican-riding-a-bicycle/ 를 진지하게 로부…

#software #programming #tech-trends
1주 전 · ai · - · -

[Paper] 루프된 Transformers의 안정성 및 일반화

Looped transformers는 더 어려운 문제에 더 많은 iterations를 사용함으로써 test-time compute scaling을 약속하지만, 어떤 architectural choices가 이를 가능하게 하는지는 아직 명확하지 않다.

#research #paper #ai #machine-learning
1주 전 · it · - · -

새로운 해저 케이블 절단기가 인터넷 백본을 위협한다

중국의 “deep‑sea cable‑cutting technology” 시연은 “show of strength”를 의미한다고 머카터 인스티튜트 포 차이나(Mercator Institute for China)의 분석가 웬디 창이 말했다.

#undersea cables #submarine infrastructure #China #cybersecurity #critical infrastructure #geopolitics
1주 전 · it · - · -

영국, 6억 7500만 달러 규모의 Sovereign AI Fund 출범

다른 국가의 기술 의존을 최소화하기 위한 노력의 일환으로, 영국 정부는 국내 AI 스타트업에 자원을 대거 투입하고 있다....

#it #tech-news #culture
1주 전 · it · - · -

Microsoft와 Stellantis가 AI를 사용해 자동차 소유자를 돕고 싶어한다

무슨 일이 일어나고 있나요? > “AI가 급속히 발전함에 따라, 우리는 엔지니어링 및 제조에서 디자인 및 고객 상호작용에 이르기까지 비즈니스 전반에 걸쳐 초기 채택자였습니다.”

#it #tech-news #science
1주 전 · software · - · -

GitHub CLI로 에이전트 스킬 관리

Agent skills는 개발자들이 AI coding agents와 작업하는 방식을 재구성하고 있습니다. 오늘 우리는 GitHub CLI의 새로운 명령어인 gh skill을 출시합니다. 이 명령어는 쉽게 …

#software #github #updates
1주 전 · ai · - · -

[Paper] 토큰에서 단계로: Verification-Aware Speculative Decoding for Efficient Multi-Step Reasoning

Speculative decoding (SD)은 가벼운 초안 모델이 더 강력한 타깃 모델이 검증하는 출력을 제안하도록 함으로써 대형 언어 모델 추론을 가속화합니다.

#research #paper #ai #nlp
1주 전 · ai · - · -

[Paper] 로그-배리어를 이용한 밴딧 피드백 매트릭스 게임에서 최적의 last-iterate 수렴

우리는 제로섬 행렬 게임에서 minimax 정책을 학습하는 문제를 연구한다. Fiegel et al. (2025)은 최근 이 분야에서 마지막 반복 수렴(last-iterate convergence)을 달성하는 것이…

#research #paper #ai #machine-learning
1주 전 · devops · - · -

왜 MicroVMs인가: Docker 샌드박스 뒤의 아키텍처

Docker 샌드박스: 에이전트를 YOLO 모드로 실행, 안전하게 에이전트가 임계값을 넘어섰습니다. 전체 프로덕션 코드의 4분의 1 이상이 이제 AI‑authored이며, 개발자들은…

#microVM #Docker #sandbox #container security #agents
1주 전 · software · - · -

거의 모든 것을 위한 Codex

개요 우리는 Codex에 대한 대규모 업데이트를 출시합니다. 이를 통해 매주 300만 명이 넘는 개발자들이 가속화를 위해 사용하는 보다 강력한 파트너가 됩니다.

#software #programming #tech-trends
1주 전 · software · - · -

왜 나는 내 4번째 Claude Code 인스턴스를 죽였는가 — 멀티에이전트 인디 개발에서 얻은 교훈

설정: 저는 Flutter Web + Supabase를 사용해 Jibun Inc.라는 앱을 만들고 있습니다 — 21개의 경쟁사인 Notion, Evernote 등의 기능을 흡수하는 AI 생활 관리 허브.

#software #programming #community
1주 전 · software · - · -

왜 당신의 ATS가 이력서의 40%를 거부하는가 (지원자 때문이 아니다)

우리는 최근에 한 채용 대행사가 겪고 있던 고통스러운 문제를 디버깅하도록 도왔습니다. 그들의 ATS가 파이프라인을 통해 들어오는 이력서의 거의 절반을 조용히 거부하고 있었습니다. 후보…

#software #programming #community
1주 전 · ai · - · -

[Paper] 단일 모델 최적화를 넘어: Continual Reinforcement Learning에서 Plasticity 보존

Continual reinforcement learning은 보존과 적응 사이의 균형을 맞춰야 하지만, 많은 방법이 여전히 single-model preservation에 의존하며, 하나의 진화하는 po에 전념한다.

#research #paper #ai #machine-learning
1주 전 · software · - · -

터미널 테마는 당신이 코드를 스캔하고 있다고 가정합니다. 나는 문단을 읽고 있습니다.

개요: Claude Code 세션을 시작한 지 6시간이 지나자, 나는 코드가 아니라 도구 출력—permission prompts, reasoning blocks, 그리고 prose t…에 눈을 가늘게 뜨고 있었다.

#terminal themes #UI design #color contrast #APCA #WCAG #Claude Code #accessibility #Yves Klein Blue #terminal.app
1주 전 · it · - · -

Roku는 미국 가정의 절반 이상에 보급, 1억 돌파

!https://9to5google.com/wp-content/uploads/sites/4/2024/09/roku-ultra-2024-3.jpg?quality=82&strip=all&w=1600 Roku는 주요 이정표를 달성했으며, 플랫폼 n...

#Roku #streaming #100 million households #broadband adoption #smart TV #media devices
1주 전 · software · - · -

MCP 서버가 콘텐츠 퍼블리싱을 위해 실제로 해야 하는 일

콘텐츠 출판을 위한 MCP 서버는 AI 어시스턴트를 출판 파이프라인으로 전환합니다. 마크다운 초안을 작성하면, 어시스턴트가 서버의 도구를 호출하고…

#software #programming #community
1주 전 · it · - · -

다음 Android 앱은 AI가 만들 수도 있으며, Google은 이를 제대로 만들길 원한다

TL;DR - AI 도구 덕분에 Android 앱을 그 어느 때보다 쉽게 만들 수 있게 되었습니다.

#it #android #mobile
1주 전 · it · - · -

OpenAI Codex 업데이트, Mac에서 컴퓨터 사용, 이미지 생성 및 메모리 추가

개요 OpenAI는 https://openai.com/index/codex-for-almost-everything/ 에서 Codex AI 코딩 에이전트에 여러 업데이트를 진행하고 있습니다. Codex는 이제 desktop Mac에서 작동할 수 있습니다.

#it #apple #mac
1주 전 · it · - · -

OpenAI의 대규모 Codex 업데이트는 Anthropic의 Claude Code에 대한 직접적인 도전이다.

개요: OpenAI는 에이전틱 코딩 및 개발 시스템인 Codex를 강화하기 위해 일련의 업데이트를 제공하여 컴퓨터를 사용하고, 이미지를 생성하며, 기억…

#it #products #tech-news
1주 전 · ai · - · -

OpenAI의 대규모 Codex 업데이트는 Claude Code에 대한 직접적인 도전이다

개요: OpenAI는 agentic coding 및 개발 시스템인 Codex를 일련의 업데이트로 강화하고 있습니다 https://openai.com/index/codex-for-almost-everything/ th...

#OpenAI #Codex #AI coding assistant #agentic AI #Claude Code #AI competition #software automation
1주 전 · it · - · -

OpenAI의 최신 Codex 업데이트가 다가오는 슈퍼앱을 위한 기반을 구축한다

배경: 지난달, The Wall Street Journal의 보도에 이어 OpenAI는 ChatGPT와 그 외 기능을 결합한 desktop super app을 개발 중이라고 확인했습니다.

#it #gadgets #products
1주 전 · ai · - · -

[Paper] Context Over Content: 자동화된 Judges에서 평가 조작 노출

LLM-as-a-judge 패러다임은 자동화된 AI 평가 파이프라인의 운영 백본이 되었지만, 검증되지 않은 가정에 기반하고 있습니다: 즉, 심사자들이 평가한다는…

#research #paper #ai #machine-learning #nlp
1주 전 · software · - · -

HPC가 클라우드 또는 전통적인 서버와 다른 점은 무엇인가

전통 서버가 설계된 목적 전통 서버는 다음을 처리하도록 구축됩니다: - Web applications - Databases - File storage - Enterprise applications

#software #programming #community
1주 전 · ai · - · -

[Paper] AI-Assisted Requirements Engineering: 전문가 판단에 대한 실증 평가

인공지능은 시스템 엔지니어링 활동에 점점 더 도입되고 있으며, 특히 요구사항 엔지니어링 분야에서 품질 평가가.

#research #paper #ai #machine-learning
1주 전 · it · - · -

RFK Jr.가 2023년 금지 이후 12개의 입증되지 않은 peptides를 재검토하도록 FDA에 압박

외부 전문가와 감시 단체들은 케네디가 7월 첫 회의 전에 자문 위원회를 자격이 의심스러운 동맹들로 채우려 할 것이라고 의심한다.

#it #tech-news #science
1주 전 · ai · - · -

[Paper] 만화 캡션 작가처럼 생각하기 학습: Incongruity-Resolution Supervision for Multimodal Humor Understanding

유머는 추론을 올바르게 하는 것이 정답을 맞추는 것만큼 중요한 몇 안 되는 인지 작업 중 하나입니다. 최근 연구에서는 유머를 평가…

#research #paper #ai #machine-learning #nlp
1주 전 · it · - · -

Meta, 다음 주에 Quest 헤드셋 및 리퍼비시드 제품까지 가격 인상

!https://9to5google.com/wp-content/uploads/sites/4/2024/11/Meta-Quest-3.webp?w=1200 Meta는 Meta Quest 3 시리즈 헤드셋의 가격 인상을 발표했습니다…

#Meta #Quest 3 #VR headset #price increase #hardware #memory chips #refurbished devices
1주 전 · ai · - · -

[Paper] MADE: 의료기기 부작용 사건의 불확실성 정량화를 포함한 다중 라벨 텍스트 분류를 위한 Living Benchmark

Machine learning이 의료와 같은 고위험 분야에서는 강력한 예측 성능뿐만 아니라 신뢰할 수 있는 불확실성 정량화(UQ)를 필요로 한다...

#research #paper #ai #nlp
1주 전 · software · - · -

MaxText, 사후 훈련 기능 확장: 단일 호스트 TPU에서 SFT와 RL 도입

2026년 4월 16일 빠르게 진화하는 대형 언어 모델(Large Language Models, LLMs) 분야에서 사전 학습(pre‑training)은 첫 번째 단계에 불과합니다. 기본 모델(base model)을 특화된 모델로 전환하려면...

#software #google #developers

Newer posts

Older posts