[Paper] 구조-기능 뇌 표현 학습을 위한 Multi-Scale Adaptive Graph Attention for Cognitive Insight
뇌 구조와 기능이 어떻게 상호작용하는지를 이해하는 것은 지능을 설명하는 데 핵심이며, 그러나 구조와 기능을 동시에 모델링하는 것은 구조와 기능이…
뇌 구조와 기능이 어떻게 상호작용하는지를 이해하는 것은 지능을 설명하는 데 핵심이며, 그러나 구조와 기능을 동시에 모델링하는 것은 구조와 기능이…
Surgical video understanding은 컴퓨터 보조 수술에 필수적이지만, 기존의 surgical foundation models는 데이터 규모가 제한되어 있습니다,…
외과 수술은 본질적으로 복잡하고 위험하며, 광범위한 전문 지식과 지속적인 집중이 필요하여 변화하는 수술 중 상황을 잘 파악해야 합니다. Computer...
물질 사용 시작(SUI) 위험이 있는 청소년을 조기에 식별하는 것은 중요하지만 어려운 일입니다. 대부분의 예측 변수는 connectivity를 정적이거나 횡단적인 것으로 취급하기 때문입니다…
최근 추론 대형 언어 모델(LLM)의 발전은 주로 사전 사고에 의존해 왔으며, 여기서 추론은 최종 답변 전에 이루어집니다. 그러나 이것은 a...
효과적인 협업은 팀이 Socially Shared Regulation of Learning (SSRL)을 통해 복잡한 인지 및 감정 상태를 관리하도록 요구합니다. Physiological syn...
이 논문은 다국어 저널리즘에서 문장 수준의 텍스트 재사용을 조사하여, 재사용된 콘텐츠가 기사 내에서 어디에 나타나는지를 분석합니다. 우리는 weakly supervised …
자동화된 방사선 보고서 요약은 장황한 소견을 간결한 임상 인상으로 압축하는 것을 목표로 하지만, 기존 멀티모달 모델은 종종 ...
문제: 모든 최신 AI 프로젝트는 에이전트에게 더 많은 자율성을 부여하고 있습니다—쉘 명령 실행, 웹 탐색, API 호출, 자금 이동, 심지어 수행하는 ...
FLEURS는 100개 이상의 언어에 대해 n-way parallel speech를 제공하지만, 북부 쿠르드어는 그 중 하나가 아니어서 자동 음성 인식 및 …에 대한 benchmarking을 제한합니다.
!https://cdn-avatars.huggingface.co/v1/production/uploads/639bcaa2445b133a4e942436/CEW-OjXkRkDNmTxSu8Egh.png ibm-granite/granite-4.0-3b-vision 이미지-텍스트-투-텍스트
Particle Swarm Optimization (PSO) 및 Evolutionary Algorithms (EA)와 같은 메타휴리스틱 알고리즘은 해 공간을 탐색하는 데 뛰어나지만, 메커니즘이 부족합니다…
오늘 우리는 1,220억 달러의 약정 자본으로 최신 펀딩 라운드를 마감했으며, 사후 평가액은 8,520억 달러입니다. OpenAI는 핵심 인프라가 되고 있습니다.
항상 켜져 있는 엣지 카메라는 연속적인 비디오 스트림을 생성하며, 중복된 프레임이 정답 결과를 top‑k 검색에서 밀어내어 교차 모달 검색 성능을 저하시킵니다. T...
시스템 프롬프트에서 한 줄을 바꿨을 뿐인데, downstream features 세 개가 깨졌어요. 테스트에서도 잡히지 않았죠—솔직히 말해서 프롬프트를 테스트하지 않으니까요. 여기…
Factory Model은 설계 결함이 있다. PwC는 모든 주요 컨설팅 회사와 마찬가지로 3년 연속으로 고객에게 “AI transformation”을 성장 스토리로 판매했다. To deliv...
대규모 복구 – 교훈 올해 나는 “Remediation at Scale”이라는 산업 보고서를 발표했습니다. https://semgrep.dev/resources/remediation-at-scale/
7일. 블라인드 투표. 그리고 내가 인정하고 싶지 않았던 깨달음. 나는 어떤 것에 대해 솔직히 말할 것이다. 나는 이것을 거의 쓰지 않을 뻔했다. 그것은 ... 때문에가 아니다.
연합 학습(FL)에서의 백도어 공격은 대부분 합성 코너 패치나 분포 외(OOD) 패턴을 사용해 평가되며, 이는 실제 상황에서 나타날 가능성이 낮다.
2026년에는 두 종류의 개발자가 있다. 첫 번째 유형은 AI 요청마다 정상적으로 비용을 지불한다. 두 번째 유형은 조용히 free quotas와 trial credit를 모은다.
현대 AI의 빠른 속도는 전통적인 산업 시스템을 방대하고 지능적이며 잠재적으로 무인 자율 운영 환경으로 급속히 변모시키고 있습니다.
Packaging Skills – The Next Evolution > 모두가 당신에게 Skills를 패키징하도록 가르칩니다. > 최고의 실무를 표준화된 워크플로우로 인코딩하고, …
‘I stopped trusting AI agents to “do the right thing” - so I built a governance system’의 커버 이미지
Trip Venturella는 https://huggingface.co/tventurella/mr_chatterbox_model 에서 Mr. Chatterbox를 출시했습니다. 이 language model은 저작권이 소멸된 빅토리아 시대 텍스트만을 사용해 완전히 학습되었습니다.
비선형 계산은 다양한 정보 처리 작업에 필수적입니다. 광학 구현은 수동적인 빛 전파를 활용할 수 있기 때문에 매력적입니다.
Large language models LLMs는 특정 시점에 학습되어 고정된 지식을 가지고 있습니다. 소프트웨어 엔지니어링 실무는 빠르게 진행되고 자주 변화하며, …
Proximal Policy Optimization Algorithms 논문 • 1707.06347 • 2017년 7월 20일 발표 • 11...
fjo3가 France 24의 보고서를 공유합니다: 분석할 코드 라인이 너무 많고, 다루어야 할 AI assistants 군대가 있으며, 긴 프롬프트를 작성해야 하는 것이 불평 중 하나입니다 b...
human motion의 합성은 빠르게 발전했지만, 현실적인 hand motion과 bimanual interaction은 아직 충분히 탐구되지 않았다. Whole-body models는 종종 fine-gr…
3D human mesh estimation을 위한 라벨이 있는 데이터셋을 확보하는 것은 depth ambiguities와 monocular 이미지에서 3D geometry를 annotating하는 고유한 어려움 때문에 어렵습니다.
현대 Text-to-Image (T2I) diffusion 모델은 놀라운 의미 정렬을 달성했지만, 종종 상당한 다양성 부족으로 고통받으며 특정 결과에 수렴합니다.
조작 중 인간 손과 물체에 대한 정확한 3D 이해는 egocentric computer vision에서 여전히 중요한 도전 과제입니다. 기존 hand‑object …
시각 장면 생성(visual scene generation) 분야에서 엄청난 진전이 이루어져 이제 단일 이미지를 탐색 가능한 3D 세계로 변환하지만, 사운드 없이는 immersion이 완전하지 않습니다. 우리는 ...
재귀 네트워크는 온라인으로 적응하기 위해 Jacobian 전파가 필요하지 않습니다. 은닉 상태는 이미 순방향 패스를 통해 시간적 크레딧을 전달합니다; 즉각적인 deriva...
선형 표현 가설은 신경망 활성화가 고수준 개념을 선형 혼합으로 인코딩한다는 것을 주장한다. 그러나 superposition 하에서는 이것은 …
대규모 언어 모델에 대한 스케일링 법칙은 옵티마이저와 파라미터화에 크게 의존합니다. 기존의 하이퍼파라미터 전이 법칙은 주로 f...
우리는 ParaSpeechCLAP를 소개합니다. 이 듀얼-인코더 contrastive model은 speech와 text style captions를 공통 embedding space에 매핑하여 다양한 범위의…를 지원합니다.
AI-augmented ecosystems(여러 AI 구성 요소가 공유 데이터와 인프라를 통해 상호 작용하는 상호 연결된 시스템) 은 건축적 ...
우리는 복잡한 최적화 작업인 칩 플로어플래닝에서 매크로 배치를 위해 Vision-Language Models (VLMs)를 사용하는 것을 제안합니다. 이 작업은 최근 유망한 발전을 보여주고 있습니다.
로봇 매핑 시스템은 일반적으로 로봇 자체의 센서와 카메라를 사용하여 metric-semantic scene representations를 구축하는 접근 방식을 취합니다. 그러나 이러한 'first person'…
현대 분산 시스템은 이기종 서비스, 서로 다른 스키마 버전을 가진 REST API, GraphQL 엔드포인트, 그리고 독점적인 페이로드를 가진 IoT 디바이스를 통합합니다.
Vision-language models (VLMs)은 다양한 작업에서 인상적인 능력을 보여주었으며, 이러한 모델을 활용해 로봇 학습을 감독하려는 노력을 촉진하고 있습니다.
Flow‑GRPO는 reinforcement learning을 flow models에 성공적으로 적용하지만, 모든 단계에 걸쳐 uniform credit assignment를 사용합니다. 이는 temporal structure를 무시합니다…
우리는 오프라인 데이터로부터 정책 학습을 위한 cross-fitted debiasing device를 제안한다. 결과적인 학습 원칙의 핵심적인 결과는 sqrt N regret even for ...
Facial recognition systems는 법 집행 및 보안 분야에서 점점 더 많이 배치되고 있으며, 여기서 algorithmic decisions는 상당한 사회적 결과를 초래할 수 있습니다…
Federated Learning (FL)은 대규모 분산 데이터를 활용하면서 프라이버시를 보호할 수 있는 능력 때문에 점점 더 널리 채택되고 있습니다. 그러나, ...
심리 척도 개발은 전통적으로 광범위한 전문가 참여, 반복적인 수정, 대규모 파일럿 테스트를 거쳐 psychometric …
Generative AI의 새로운 배포는 단일 trusted server가 아니라 분산되고 heterogeneous한 edge devices 전반에 걸쳐 inference를 점점 더 실행하고 있다....