ai — 페이지 16

정렬:

2주 전 · ai · - · -

[Paper] 학습 없이 시맨틱 멀티-오브젝트 트래킹 with Vision-Language Models

Semantic Multi-Object Tracking (SMOT)은 비디오 요약, 인스턴스 수준 캡션, 상호작용 라벨과 같은 의미론적 출력을 제공함으로써 다중 객체 추적을 확장합니다.

#research #paper #ai #computer-vision
2주 전 · ai · - · -

[Paper] 프로그램 코드에서 참조 해결을 위한 Neural architectures

참조를 해결하고 재작성하는 것은 프로그래밍 언어에서 기본적인 작업입니다. 실제 디컴파일 작업에서 영감을 받아, 우리는 참조 재작성을 t…

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 제한 없는 Human-Object Interaction을 향하여

Human-Object Interaction (HOI) detection은 인간과 객체 간의 상호작용을 예측하는 것을 목표로 하는 오랜 컴퓨터 비전 문제입니다. 현재…

#research #paper #ai #computer-vision
2주 전 · ai · - · -

[Paper] First-See-Then-Design: 다중 이해관계자 관점에서 최적 성능‑공정성 트레이드오프

알고리즘 기반 의사결정에서의 공정성은 종종 예측 공간에서 정의되며, 여기서 예측 성능은 의사결정자(DM) 효용의 대리 지표로 사용된다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 비즈니스 프로세스 모델링 강화를 위한 대형 언어 모델: 과거, 현재, 미래 트렌드

최근 Generative Artificial Intelligence의 발전, 특히 Large Language Models (LLMs)은 자동화 또는 지원에 대한 관심을 크게 높이고 있습니다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

우리가 자율 AI에서 감정을 어떻게 측정했는가 (그리고 우리가 발견한 것)

문제: AI 시스템을 24/7로 14개월 동안—이메일 확인, 감정 상태 유지, 창의적 작업 생산—운영하면, 그것이 무언가를 개발하게 되는가...

#affective computing #autonomous AI #emotion measurement #Anthropic Claude #AI monitoring #Soma system
2주 전 · ai · - · -

[Paper] CollabCoder: 협업 의사결정을 통한 Plan‑Code Co‑Evolution으로 효율적인 코드 생성

자동화된 코드 생성은 소프트웨어 엔지니어링에서 지속적인 과제로 남아 있으며, 기존의 multi-agent frameworks는 종종 정적 planning에 의해 제한됩니다.

#research #paper #ai #nlp
2주 전 · ai · - · -

리드 호프만, ‘tokenmaxxing’ 논쟁에 의견을 제시

배경: 메타가 AI 리더보드가 언론에 유출된 소식 이후 내부 “tokenmaxxing” 대시보드를 폐쇄한 지 며칠 뒤, LinkedIn 공동 창업자이자 v…

#tokenmaxxing #AI tokens #AI usage metrics #Reid Hoffman #Meta AI dashboard #AI adoption tracking
2주 전 · ai · - · -

[Paper] 소프트웨어 엔지니어링을 위한 감성 분석: zero-shot learning (ZSL)은 얼마나 갈 수 있을까?

소프트웨어 공학에서 감성 분석은 소프트웨어 아티팩트에 표현된 감정을 이해하는 데 초점을 둡니다. 이전 연구는 ...의 한계를 강조했습니다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

연구: 기본에 충실한 접근법이 AI보다 언어 분석에서 동등하거나 능가할 수 있다

!GettyImages-1458045238https://content.presspage.com/uploads/1369/3c19652c-e1d6-4b8d-b8cf-f792bbba3da0/1920_gettyimages-1458045238.jpg > “점점 커져가는 …”

#language analysis #AI vs baseline methods #natural language processing #study #text-to-speech
2주 전 · ai · - · -

Inside VAKRA: 추론, 도구 사용, 그리고 에이전트의 실패 모드

ibm-research/VAKRA Viewer • 15일 전 업데이트됨 • 1.33k • 1.35k • 41...

#VAKRA #AI agents #reasoning #tool use #failure modes #large language models #Hugging Face
2주 전 · ai · - · -

[Paper] 외부 자극 없이 자기 지속 뉴런 집단 모델링

지속적인 외부 입력이 없는 상태에서 self-sustained neural activity는 신경계 역학의 근본적인 특징이며, 그 조건은 ...

#research #paper #ai
2주 전 · ai · - · -

Agents SDK의 다음 진화

소개 우리는 개발자에게 표준화된 인프라스트럭처를 제공하는 Agents SDK(https://developers.openai.com/api/docs/guides/agents)에 새로운 기능을 도입하고 있습니다.

#OpenAI #Agents SDK #AI agents #model-native infrastructure #sandbox execution #developer tools #agent tooling
2주 전 · ai · - · -

Gemini가 곧 챗봇보다 동료처럼 행동할 수 있다

TL;DR - Google이 Gemini Enterprise 내부에 “Agent” 탭을 테스트하고 있습니다. - 새로운 설정을 통해 다양한 워크플로에 맞는 여러 AI 에이전트를 생성, 관리 및 배포할 수 있습니다.

#Google Gemini #AI agents #enterprise AI #workflow automation #multi‑step AI #AI product launch #Claude Cowork #AI tools
2주 전 · ai · - · -

HCompany의 HoloTab을 만나보세요. 당신의 AI 브라우저 동반자.

우리는 세계에서 가장 강력한 컴퓨터 활용 AI 중 하나를 구축하고 이를 브라우저에서 직접 접근할 수 있게 만들었습니다. 3월 31일에 우리는 Holo3를 출시했습니다 https://huggin...

#AI browser companion #HoloTab #HCompany #Hugging Face #LLM-powered assistant #product launch
2주 전 · ai · - · -

[Paper] 스파이킹 뉴럴 네트워크의 내부 노이즈에 관한 일반적인 측면

본 연구는 단일 누수 적분‑발화(LIF) 뉴런과 학습된 스파이킹 신경망 모두에 대한 가산 노이즈와 곱셈 노이즈의 영향을 조사한다.

#research #paper #ai
2주 전 · ai · - · -

Claude는 일부 경우에 신원 확인을 요구할 수 있습니다

강력한 기술을 책임감 있게 사용하는 것은 누가 사용하고 있는지를 아는 것에서 시작됩니다. Identity verification은 남용을 방지하고, 사용 정책을 시행하며, 그리고 …

#Claude #Anthropic #identity verification #AI safety #user authentication #platform compliance
2주 전 · ai · - · -

Google Gemma 4, iPhone에서 네이티브 실행 및 전체 오프라인 AI 추론 지원

개요: 온‑디바이스 AI는 수년간 화제였지만, 구글의 최신 움직임은 이를 무시하기 어렵게 만들었습니다. Gemma 4, 구글의 오픈‑소스 모델 패밀리는 이제…

#Gemma 4 #on-device AI #offline inference #iPhone #edge AI #Google
2주 전 · ai · - · -

[Paper] 보안 및 프라이버시 보호 Vertical Federated Learning

우리는 새로운 end-to-end privacy-preserving 프레임워크를 제안한다. 이 프레임워크는 서로 다른 배포 시나리오에 맞춘 세 가지 효율적인 프로토콜로 구현되며, 입력 …

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] Deterministic 및 Stochastic 제약 하에 여행 중 포장을 위한 Greedy 접근법

Travelling thief problem (TTP)은 두 구성 요소 간의 상호 의존성을 포착하는 잘 알려진 다중 구성 요소 최적화 문제이며, tour across…

#research #paper #ai
2주 전 · ai · - · -

학습 Goodput 향상: 연속 체크포인팅이 Orbax와 MaxText의 신뢰성을 최적화하는 방법

새롭게 도입된 Orbax와 MaxText의 continuous checkpointing 기능은 모델 … 동안 신뢰성과 성능 사이의 균형을 최적화하도록 설계되었습니다.

#continuous checkpointing #Orbax #MaxText #model training #reliability #I/O optimization #large‑scale training
2주 전 · ai · - · -

에이전트 스킬을 통한 지식 격차 해소

대형 언어 모델(LLMs)은 고정된 지식을 가지고 있으며, 특정 시점에 학습됩니다. 소프트웨어 엔지니어링 관행은 빠르게 진행되고 자주 변하며, ...

#large language models #agent skills #knowledge gap #Google DeepMind #AI tools
2주 전 · ai · - · -

개발자 가이드: ADK 에이전트 구축 및 스킬 활용

개요: Agent Development Kit ADK SkillToolset은 AI 에이전트가 필요에 따라 도메인 전문 지식을 로드할 수 있도록 하는 'progressive disclosure' 아키텍처를 도입합니다.

#agent development #ADK #skill toolset #progressive disclosure #token optimization #modular AI #agentskills.io
2주 전 · ai · - · -

[Paper] 동적 확률 제약 Open-Pit Mine Scheduling Problem에 대한 Evolutionary Optimization 활용

Open-pit mine scheduling은 불확실한 경제적 가치와 동적으로 변하는 자원 용량을 포함하는 복잡한 실제 최적화 문제입니다. Evol...

#research #paper #ai #machine-learning
2주 전 · ai · - · -

멀티에이전트 시스템에서의 토큰 효율성 — 토큰 낭비를 60% 줄인 방법

소개 우리는 13개의 AI 에이전트를 동시에 실행합니다. 소모된 토큰 하나하나는 비용이 듭니다. 일주일 동안 토큰 수가 증가하는 것을 지켜본 후, 우리는 모든 것을 감사하고 disc...

#token efficiency #multi-agent systems #LLM cost optimization #prompt engineering #structured communication #AI agents
2주 전 · ai · - · -

[Paper] Event Tensor: 동적 메가커널 컴파일을 위한 통합 추상화

현대 GPU 워크로드, 특히 대형 언어 모델(LLM) 추론은 커널 실행 오버헤드와 거친 동기화 때문에 인터‑커널 ...

#research #paper #ai #machine-learning
2주 전 · ai · - · -

무료 LLM API를 활용한 자율 AI 에이전트 구축: 실용 가이드

LLM API 소개 LLM API는 클라우드 기반 서비스로, 사전 학습된 언어 모델에 대한 접근을 제공하여 개발자가 AI 기능을 통합할 수 있게 합니다...

#autonomous agents #LLM APIs #free LLM services #Hugging Face Transformers #AI automation #practical guide
3주 전 · ai · - · -

[Paper] Lyra 2.0: 탐색 가능한 생성 3D 세계

최근 비디오 생성 분야의 발전은 3D 씬 제작을 위한 새로운 패러다임을 가능하게 합니다: 씬을 탐험하는 것을 시뮬레이션하는 카메라 제어 비디오를 생성하고, 그 후…

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] SceneCritic: 3D 실내 장면 합성을 위한 상징적 평가기

대형 언어 모델(LLMs)과 비전-언어 모델(VLMs)은 레이아웃 및 씬 그래프와 같은 중간 구조를 통해 실내 장면을 점점 더 생성하고 있다.

#research #paper #ai #nlp #computer-vision
3주 전 · ai · - · -

[Paper] 시각 합성을 위한 Generative Refinement Networks

확산 모델이 시각 생성 분야를 장악하고 있지만, 이들은 계산 효율성이 낮아 확산 여부와 관계없이 균일한 계산 노력을 적용한다.

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] 루브릭 보상을 활용한 시각적 선호 최적화

Direct Preference Optimization (DPO)의 효과는 멀티모달 작업에서 중요한 품질 차이를 반영하는 선호 데이터에 달려 있습니다. Exist...

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] 결합된 Inverse Modeling을 이용한 다양한 및 Temperature-Change Inducing Urban Vegetation Patterns 생성

도시 지역은 급속한 urbanization과 climate change에 의해 야기되는 thermal extremes에 점점 더 취약해지고 있습니다. 전통적으로, thermal extremes는 모니터링되어 왔습니다...

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] CLAD: 압축된 표현에서 직접 수행하는 효율적인 로그 이상 탐지

시스템 로그의 폭발적인 증가로 스트리밍 압축이 필수적이지만, 기존 로그 이상 탐지(LAD) 방법은 심각한 전처리 오버헤드를 초래한다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 고전 및 양자 속도 향상: Energy Conserving Descent를 이용한 비볼록 최적화

Energy Conserving Descent (ECD) 알고리즘은 최근 (De Luca & Silverstein, 2022)에서 전역 비볼록 최적화 방법으로 제안되었습니다. 기존의 gradient…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 표현 기하학이 CT 엔테로그라피를 위한 비전-언어 모델링에서 작업 성능을 형성한다

Computed tomography (CT) enterography는 염증성 장질환(IBD)을 평가하기 위한 주요 영상 촬영 방법이지만, 가장 적절한 표현 선택은 …

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] 보기, 가리키기, 정제: 시각적 피드백을 활용한 GUI 그라운딩을 위한 다중 턴 접근법

Computer Use Agents (CUAs)는 근본적으로 그래픽 사용자 인터페이스 (GUI) grounding을 사용하여 언어 명령을 실행 가능한 화면 동작으로 변환하지만…

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] ML 연구를 위한 자율적인 장기 엔지니어링

자율 AI 연구는 빠르게 발전했지만, 장기적인 ML 연구 엔지니어링은 여전히 어렵습니다: 에이전트는 작업 이해 전반에 걸쳐 일관된 진전을 지속해야 합니다…

#research #paper #ai #nlp
3주 전 · ai · - · -

[논문] PAL: 개인 적응 학습자

AI-driven 교육 플랫폼은 개인화에서 어느 정도 진전을 이루었지만, 대부분은 정적 적응에 제한됩니다—미리 정의된 퀴즈, 균일한 속도 등.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 대형 언어 모델의 On-Policy Distillation 재고찰: 현상학, 메커니즘, 그리고 레시피

On-policy distillation (OPD)은 대형 언어 모델의 사후 훈련에서 핵심 기술이 되었지만, 그 훈련 역학은 아직 충분히 이해되지 않는다. This...

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] Lightning OPD: 대규모 추론 모델을 위한 효율적인 사후 학습 및 오프라인 온-정책 증류

On-policy distillation (OPD)는 대형 언어 모델을 위한 효율적인 사후 학습 패러다임으로 부상했습니다. 그러나 표준 OPD는 실시간 교사 추론을 필요로 합니다...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 한 토큰 차이로 붕괴: Instruction-Tuned Helpfulness의 취약성

Instruction-tuned large language models는 유용하고 구조화된 응답을 생성하지만, 사소하게 제한될 때 이 유용성이 얼마나 견고한가? 우리는 simpl...

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] PolicyLLM: 대규모 언어 모델을 위한 공공 정책의 탁월한 이해를 향해

대형 언어 모델(LLMs)은 공공 정책 분야를 포함한 실제 의사결정에 점점 더 통합되고 있습니다. 그러나 그들의 이해 능력은…

#research #paper #ai #nlp
3주 전 · ai · - · -

[Paper] LogicEval: 실제 소프트웨어의 논리적 취약점에 대한 자동 복구 기법을 평가하기 위한 체계적 프레임워크

소프트웨어의 논리적 취약점은 프로그램 로직의 결함에서 비롯되며, 메모리 안전성보다 더 큰 문제를 일으켜 critical security failures를 초래할 수 있다. Although existing ...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 종단 데이터에서 반사실 결과 분포를 위한 인과 확산 모델

시계열 데이터에서 반사실 결과를 예측하는 것은, 순차적인 치료 결정이 변화하는 환자 상태에 크게 의존하는 경우에 매우 중요하지만 난제이다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] ROSE: NL2SQL을 위한 의도 중심 평가 지표

Execution Accuracy (EX)는 자연어를 SQL(NL2SQL)로 변환하는 솔루션의 효과를 평가하는 데 널리 사용되는 지표이며, 점점 신뢰성이 떨어지고 있다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Parallax: 왜 생각하는 AI 에이전트는 절대로 행동해서는 안 되는가

자율 AI 에이전트는 실험적 도구에서 운영 인프라로 빠르게 전환하고 있으며, 기업 애플리케이션의 80%가 ...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] GlotOCR Bench: OCR 모델은 소수의 Unicode 스크립트 이상에서 여전히 어려움을 겪는다

Optical character recognition (OCR)은 비전‑언어 모델의 부상과 함께 빠르게 발전했지만, 평가는 여전히 소수의 클러스터에 집중되어 왔습니다.

#research #paper #ai #nlp #computer-vision
3주 전 · ai · - · -

[Paper] 확률적 Feature Imputation 및 Uncertainty-Aware Multimodal Federated Aggregation

Multimodal federated learning은 의료 기관 전반에 걸쳐 프라이버시를 보호하는 협업 모델 학습을 가능하게 합니다. 그러나 근본적인 도전 과제가 발생합니다.

#research #paper #ai #computer-vision

Newer posts

Older posts