ai — 페이지 8

정렬:

1주 전 · ai · - · -

버그를 활용하라, 모델 버그는 제외

Harness 버그, 모델 버그가 아닌 표지 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fraw.gith...

#Anthropic #Claude #LLM #AI bugs #postmortem #model harness #AI code reliability #software engineering
1주 전 · ai · - · -

다른 언어 모델은 유사한 숫자 표현을 학습한다

초록: 자연어 텍스트로 훈련된 언어 모델은 T = 2, 5, 10이라는 우세한 주기를 갖는 주기적 특징을 이용해 숫자를 표현하는 방법을 학습한다. 이 논문에서 우리는 …

#language models #transformers #periodic features #Fourier analysis #number representation #modular classification #embeddings
1주 전 · ai · - · -

[Paper] 수학 추론 평가 재고: 상징적 경직성을 넘어서는 견고한 LLM-as-a-Judge 프레임워크

최근 large language models의 발전으로 수학적 추론을 포함한 다양한 작업에서 상당한 향상이 이루어졌으며, 이는 평가에 사용됩니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 유용한 nonrobust 특징은 생물의학 이미지에 널리 존재한다

우리는 의료 영상에 대한 deep networks가 인간이 해석할 수 없고 매우 취약한 predictive input patterns와 같은 유용한 nonrobust features를 학습하는지 연구한다.

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] QuantClaw: 중요한 곳에서의 정밀함, OpenClaw를 위해

OpenClaw와 같은 자율 에이전트 시스템은 긴 컨텍스트 입력과 다중 턴 추론으로 인해 상당한 효율성 문제를 야기합니다. 이는 prohi...

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

Claude Code, 가격 격차, 그리고 직접 만드는 AI의 부상

배경: 2026년 4월 21일, Anthropic는 $20 Pro 플랜에서 Claude Code를 조용히 제거했습니다—이메일도, 발표도, changelog도 없었습니다. pricing page가 변경되었습니다.

#Anthropic #Claude Code #AI pricing #LLM #AI tools #subscription model #GitHub Copilot #AI product strategy
1주 전 · ai · - · -

머신러닝이 역사적 이미지에서 알려지지 않은 일시 현상을 밝혀내다

초록: 짧은 시간 척도에서 나타났다 사라지는 일시적인 별과 같은 점 광원들이 스푸트니크 발사 이전의 천문 이미지에 기술되어 있다. 우리는 ...

#machine learning #astronomy #transient detection #image analysis #historical photographic plates #AUC #nuclear testing correlation
1주 전 · ai · - · -

[Paper] Frozen LLM을 위한 증거 강조 학습

대형 언어 모델(LLMs)은 추론을 잘하지만, 길고 잡음이 많은 문맥에 묻혀 있을 때 결정적인 증거를 놓치는 경우가 종종 있습니다. 우리는 HiLight, Evidence Emph...

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

DeepSeek, 최첨단 모델과의 격차를 ‘메우는’ 새로운 AI 모델 미리 공개

개요: 중국 AI 연구소 DeepSeek는 최신 대형 언어 모델인 DeepSeek V4의 두 가지 프리뷰 버전을 출시했습니다. https://huggingface.co/collections/deepseek-a...

#DeepSeek #large language model #Mixture-of-Experts #V4 Flash #V4 Pro #open-weight model #1 million token context #AI model preview
1주 전 · ai · - · -

중국 DeepSeek, 미국 경쟁자를 충격에 빠뜨린 지 1년 만에 새로운 AI 모델 미리 공개

중국 AI 기업 DeepSeek가 금요일에 많이 기대되는 차세대 AI 모델 V4의 미리보기를 공개했으며, 이 오픈소스 모델이 경쟁할 수 있다고 말했습니다.

#DeepSeek #V4 #large language model #open-source AI #AI coding assistants #Huawei compatibility #China AI competition #LLM benchmarks
1주 전 · ai · - · -

이 AI thirst trap 제작자들은 자신들이 오해받고 있다고 말한다

바이럴 레드카펫 순간이 잘생긴 인스타그램 인플루언서 그룹과, 그들이 실제가 아니라는 사실을 신경 쓰지 않을 정도로 성욕이 넘치는 팔로워들을 비추었다.

#AI-generated content #deepfake #virtual influencers #Instagram #synthetic media
1주 전 · ai · - · -

왜 당신의 LLM은 아마도 PII 문제를 가지고 있는가 (그리고 이를 해결하는 방법)

LLM 애플리케이션을 구축하는 대부분의 팀은 프롬프트 인젝션에 대해 생각합니다. 사용자들이 민감한 개인 데이터를 모델에 전송할 때 발생하는 일을 고려하는 팀은 훨씬 적습니다. 그것은...

#LLM #PII #privacy #data security #compliance #prompt injection #regex filtering #AI applications
1주 전 · ai · - · -

한국 경찰, 당국을 오도한 도망친 늑대 AI 이미지 제작 남성 체포

한국 경찰, 도망친 늑대의 AI 사진을 게시한 남성을 체포! 교차로 근처 도로를 따라 걷는 늑대의 뒤쪽 모습 https://ichef.bbci.co.uk/news/4...

#AI-generated image #deepfake #misinformation #South Korea #police arrest #wolf escape
1주 전 · ai · - · -

개발자들이 “Swap Models” 할 때 놓치는 세 가지 레이어 (그리고 왜 Proxy‑Routing Claude Code가 모두 깨지는가)

개발자들은 단축키를 좋아합니다. 하지만 일부 단축키는 빌드 시간을 단축할 뿐만 아니라 신뢰 경계까지 무너뜨립니다. 새로운 프록시 도구가 유포되고 있으며, 이는 여러분이 poi...

#LLM #Claude Code #model proxy #inference substrate #agentic runtime #prompt engineering #AI safety
1주 전 · ai · - · -

DeepSeek-V4: 고효율 백만 토큰 컨텍스트 인텔리전스

기사 URL: https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro 댓글 URL: https://news.ycombinator.com/item?id=47885014 점수: 134 댓글: 11…

#DeepSeek-V4 #large language model #million-token context #efficient inference #huggingface
1주 전 · ai · - · -

백악관 메모, 중국 기업들의 대규모 AI 절도 주장

!EPA 마이클 크라티오스, 백악관 기술 담당 이사 겸 고문, 마이크에 대고 연단에 서서 검은색 정장 재킷과 흰색 드레스 셔츠를 입고…

#AI #industrial espionage #China #White House #technology policy #AI theft
1주 전 · ai · - · -

DeepSeek-V4: 실제로 사용할 수 있는 백만 토큰 컨텍스트

텍스트 생성 • 158B • 약 5시간 전 업데이트 • 23 • 536 /deepseek-ai/DeepSeek-V4-Flash

#DeepSeek-V4 #million-token context #large language model #AI agents #text generation #Hugging Face
1주 전 · ai · - · -

미스터리 해결: Anthropic이 Claude의 harnesses와 운영 지침 변경이 성능 저하를 초래한 것으로 밝혀짐

몇 주 동안 개발자와 AI 파워 유저들은 Anthropic의 대표 모델들이 경쟁력을 잃고 있다고 보고했습니다. GitHub, X, Reddit 전역에서 커뮤니티는 …

#Anthropic #Claude #LLM #model degradation #AI shrinkflation #hallucinations #token efficiency #post‑mortem
1주 전 · ai · - · -

OpenAI, 새로운 GPT‑5.5 모델이 더 효율적이며 코딩에 더 뛰어나다고 말한다

개요 OpenAI는 오늘 새로운 GPT‑5.5 모델을 출시했으며, 이를 “지금까지 가장 똑똑하고 사용하기 가장 직관적인 모델이며, 새로운 방식으로 나아가는 다음 단계”라고 설명했습니다.

#OpenAI #GPT-5.5 #large language model #AI coding assistance #model efficiency #AI safety #Codex
1주 전 · ai · - · -

[Paper] Gradient를 샤드하고 모델을 스케일한다: Gradient Partitioning을 통한 Serverless Federated Aggregation

서버리스 플랫폼에서의 연합 학습(Federated learning, FL) 집계는 확고한 확장성 한계에 직면한다: 기존 아키텍처(lambda-FL, LIFL)는 클라이언트를 …

#research #paper #ai #machine-learning
1주 전 · ai · - · -

Noscroll을 만나보세요, 당신을 대신해 둠스크롤링을 해주는 AI 봇

Noscroll: 당신의 Doom‑Scrolling 아웃소싱 당신이 Doom‑Scrolling을 아웃소싱할 수 있다면 어떨까요? 그것이 새로운 스타트업 Noscroll의 전제입니다. https://noscroll.c...

#AI bot #doomscrolling #content summarization #social media automation #startup #Noscroll
1주 전 · ai · - · -

OpenAI, 향상된 맥락 이해를 갖춘 GPT-5.5 출시, Plus 및 그 이상

개요: OpenAI는 ChatGPT가 m...을 받고 있다고 발표했습니다.

#OpenAI #GPT-5.5 #ChatGPT #large language model #contextual understanding #AI advancements #coding assistance #scientific research
1주 전 · ai · - · -

OpenAI의 새로운 GPT‑5.5가 NVIDIA 인프라에서 Codex를 구동 — 그리고 NVIDIA는 이미 이를 활용하고 있다

AI 에이전트는 개발자 워크플로우에 혁신을 일으켰으며, 그 다음 경계는 지식 작업이다: 정보를 처리하고, 복잡한 문제를 해결하며, 새로운 i...

#ai #gpu #nvidia
1주 전 · ai · - · -

OpenAI, GPT-5.5 출시, 회사가 AI ‘슈퍼 앱’에 한 걸음 더 다가가다

OpenAI는 목요일에 GPT‑5.5(https://openai.com/index/introducing-gpt-5-5/)를 출시했습니다. 이는 회사가 “가장 똑똑하고 직관적인”이라고 부르는 최신 AI 모델입니다.

#OpenAI #GPT-5.5 #large language model #AI super app #agentic computing
1주 전 · ai · - · -

OpenAI가 GPT-5.5를 출시, 회사가 AI ‘superapp’에 한 걸음 더 다가가다

출시 개요 OpenAI는 목요일에 최신 AI 모델인 GPT‑5.5(https://openai.com/index/introducing-gpt-5-5/)를 발표했으며, 회사는 이를 “가장 스마트한 …”이라고 부르고 있습니다.

#OpenAI #GPT-5.5 #large language model #AI superapp #agentic computing
1주 전 · ai · - · -

OpenAI가 ChatGPT와 Codex를 GPT-5.5로 업그레이드: ‘실제 업무를 위한 새로운 지능 클래스’

!https://9to5mac.com/wp-content/uploads/sites/6/2026/02/chatgpt-app-icon-light.jpg?quality=82&strip=all&w=1600 OpenAI는 바쁜 발표 주를 마무리하고 있습니다...

#OpenAI #GPT-5.5 #ChatGPT #Codex #large language model #AI advancements #multi‑step reasoning #agentic coding #tool use
1주 전 · ai · - · -

[Paper] 작업 네트워크상의 멀티태스크 최적화

멀티태스크 최적화는 다수의 작업을 병렬로 해결하는 강력한 접근법이다. 그러나 기존 알고리즘은 뚜렷한 제한에 직면한다: Populati...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

에이전트 AI의 부상

소개 Agentic AI의 부상: 정의, 프레임워크 및 과제에 대한 검토 2025년은 AI가 반응형 어시스턴트에서 자율적인 … 로 이동하고 있음을 탐구한다.

#agentic AI #autonomous AI #intelligent agents #AI research #AI frameworks #AI challenges #AI tools
1주 전 · ai · - · -

OpenAI는 새로운 GPT-5.5 모델이 더 효율적이고 코딩에 더 뛰어나다고 말한다

개요 OpenAI는 새로운 GPT‑5.5 모델을 발표했으며, 이를 “지금까지 가장 스마트하고 직관적인 사용 모델”이자 “새로운 방식의 ...에 대한 다음 단계”라고 설명했습니다.

#OpenAI #GPT-5.5 #large language model #AI coding assistance #model efficiency #tool integration
1주 전 · ai · - · -

[Paper] 빠르고 느린 것을 관찰하기: 비디오에서 시간 흐름 학습

비디오가 빨라졌는지 느려졌는지 어떻게 알 수 있을까? 어떻게 하면 다양한 속도의 비디오를 생성할 수 있을까? 비디오는 현대 커뮤니케이션의 중심에 있었지만…

#research #paper #ai #machine-learning #computer-vision
1주 전 · ai · - · -

[Paper] 스트리밍 지속 학습에서의 Temporal Taskification: 평가 불안정성의 원인

Streaming Continual Learning (CL)은 일반적으로 연속적인 스트림을 시간적 분할을 통해 이산 작업의 시퀀스로 변환합니다. 우리는 이 …

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 생성형 대형 언어 모델을 이용한 자동 음성 인식 평가

자동 음성 인식(ASR)은 전통적으로 의미에 민감하지 않은 지표인 Word Error Rate(WER)를 사용해 평가됩니다. 임베딩 기반 의미 메트릭...

#research #paper #ai #nlp
1주 전 · ai · - · -

[Paper] Fine-Tuning 레짐은 구별되는 Continual Learning 문제를 정의한다

Continual learning (CL)은 모델이 순차적으로 작업을 습득하면서 이전에 학습한 지식을 유지하는 방법을 연구한다. 벤치마킹에서 상당한 진전이 있음에도 불구하고...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 눈 없이 보기: 웨어러블 IMU를 이용한 4D 인간‑장면 이해

인간 활동과 그 주변 환경을 이해하는 데는 일반적으로 visual perception에 의존하지만, 카메라는 프라이버시와 안전 측면에서 지속적인 문제를 제기한다.

#research #paper #ai #computer-vision
1주 전 · ai · - · -

[Paper] 멀티캘리브레이션의 샘플 복잡도

우리는 배치 설정에서 다중 보정(multicalibration)의 최소‑최대(minimax) 샘플 복잡성을 연구한다. 학습자는 알려지지 않은 분포로부터 n개의 i.i.d. 샘플을 관찰하고, 출력을 해야 한다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] Omni 모델에서 컨텍스트 언롤링

우리는 텍스트, 이미지, 비디오, 3D geometry, hidden representations 등 다양한 모달리티에 대해 원시적으로 학습된 통합 멀티모달 모델인 Omni를 제시한다. 우리는 ...

#research #paper #ai #computer-vision
1주 전 · ai · - · -

[Paper] MathDuels: LLMs를 문제 제시자와 해결자로 평가

최첨단 언어 모델(frontier language models)이 정적 수학 벤치마크(static mathematical benchmarks)에서 거의 최고 수준의 성능을 달성함에 따라, 기존 평가들은 점점 더 모델을 구별하기 어려워지고 있다.

#research #paper #ai #nlp
1주 전 · ai · - · -

[Paper] Vista4D: 4D 포인트 클라우드를 이용한 비디오 재촬영

우리는 Vista4D를 소개한다. 이는 입력 비디오와 목표 카메라를 4D 포인트 클라우드에 기반을 두는 견고하고 유연한 video reshooting 프레임워크이다. 구체적으로, 주어진…

#research #paper #ai #computer-vision
1주 전 · ai · - · -

[Paper] 프롬프트가 비전을 압도할 때: LVLMs의 Prompt-Induced Hallucinations

대규모 비전-언어 모델(LVLMs)의 능력이 인상적으로 향상되었음에도 불구하고, 이러한 시스템은 여전히 hallucinations에 취약합니다, 즉 ...

#research #paper #ai #machine-learning #nlp #computer-vision
1주 전 · ai · - · -

[Paper] 연구 질문에서 과학 워크플로우까지: Agentic AI를 활용한 과학 자동화

Scientific workflow systems는 execution—scheduling, fault tolerance, resource management—을 자동화하지만, 그 앞에 있는 semantic translation은 자동화하지 않습니다. Scienti...

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 방향성 혼동은 인간 및 기계 시각에서 Rate-Distortion Geometry를 통한 발산적인 귀납적 편향을 드러낸다

인간과 최신 vision models는 비슷한 classification accuracy에 도달할 수 있지만, 체계적으로 다른 종류의 실수를 저지릅니다—실수가 발생하는 빈도는 다르지 않고…

#research #paper #ai #computer-vision
1주 전 · ai · - · -

[Paper] 대형 모델을 위한 Low-Rank Adaptation Redux

Low-rank adaptation (LoRA)는 파라미터 효율적인 파인튜닝(PEFT)의 사실상 표준으로 부상했으며, 기반 모델의 적응을 가능하게 합니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] UniGenDet: Co‑Evolutionary 이미지 생성 및 Generated Image Detection을 위한 Unified Generative‑Discriminative Framework

최근 몇 년간 이미지 생성과 생성된 이미지 탐지 모두에서 상당한 진전이 이루어졌습니다. 그들의 빠른, 그러나 대체로 독립적인 개발에도 불구하고…

#research #paper #ai #computer-vision
1주 전 · ai · - · -

[Paper] Scale-Adaptive Framework를 이용한 Joint Spatiotemporal Super-Resolution with Diffusion Models

딥러닝 비디오 초해상도는 빠르게 발전했지만, 기후 분야에서는 일반적으로 공간이나 시간 중 하나만 초해상도(해상도 증가)를 적용하며, 그리고 …

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] GiVA: 벡터 기반 적응을 위한 Gradient-Informed Bases

모델 규모가 계속 커짐에 따라, 파라미터 효율적인 파인튜닝이 전체 파인튜닝에 대한 강력한 대안으로 부상했습니다. LoRA가 널리 채택되는 동안…

#research #paper #ai #machine-learning #nlp
1주 전 · ai · - · -

[Paper] 브라질 하원의 정치 담론 매핑: 다면적 Computational Approach

입법 행동(legislative behavior) 분석은 종종 투표 기록(voting records)에 의존하여 정치 연설(political speech)의 풍부한 의미적(semantic) 및 수사적(rhetorical) 내용을 간과한다. 이 논문에서 우리는 …

#research #paper #ai #nlp
1주 전 · ai · - · -

[Paper] Nemobot Games: 전략적 AI Gaming Agents 제작을 위한 Interactive Learning with Large Language Models

이 논문은 AI 게임 프로그래밍을 위한 새로운 패러다임을 제시하며, large language models (LLMs)을 활용해 Claude Shannon의 taxonomy를 확장하고 실용화합니다.

#research #paper #ai #machine-learning
1주 전 · ai · - · -

[Paper] 지리 기반 신호 공개: 구역 수준 청구 빈도 모델에서 환경 및 시각 예측 변수를 활용한 실증 연구

지리적 맥락은 종종 자동차 보험 위험과 관련이 있다고 여겨지지만, 공공 보험계리 데이터셋은 제한된 위치 식별자를 제공하여 이를 제약합니다.

#research #paper #ai #machine-learning

Newer posts

Older posts