AI research

정렬:

1일 전 · ai · - · -

NanoGPT Slowrun: 제한된 데이터와 무한한 연산을 이용한 언어 모델링

컴퓨팅은 데이터보다 훨씬 빠르게 성장합니다. 현재의 스케일링 법칙은 두 요소를 모두 비례적으로 증가시켜야 확장할 수 있지만, 성장의 비대칭성은 인텔리…

#language modeling #scaling laws #compute vs data #data efficiency #NanoGPT #Q Labs #generalization #AI research
1일 전 · ai · - · -

무언가가 Qwen의 땅에서 일어나고 있다

Alibaba의 Qwen 팀의 최근 개발 상황에 대해 나는 Qwen 3.5에 대한 글쓰기가 뒤처지고 있다. Qwen 3.5는 Alibaba의 Qwen 팀이 출시한 눈에 띄는 open‑weight 모델 패밀리이다.

#Qwen #Alibaba #open-weight models #large language models #AI research #team departures
1주 전 · it · - · -

OpenAI, 런던 사무실 대규모 확장 발표

샌프란시스코에 본사를 둔 AI 연구소가 런던에서 연구팀을 확장하고 있다. 이번 움직임은 구글 딥마인드와 직접 경쟁하여 최고의 연구 인재를 확보하려는 것이다.

#OpenAI #London office #company expansion #AI research #DeepMind #talent competition #UK tech
1주 전 · ai · - · -

Riley Walz, 실리콘밸리의 광대, OpenAI에 합류한다

그 소프트웨어 엔지니어는 온라인 스턴트로 유명하다. 이제 그는 ChatGPT 뒤에 있는 회사에 합류해 인간이 AI 시스템을 사용하는 새로운 방법을 연구한다....

#OpenAI #Riley Walz #ChatGPT #AI hiring #Silicon Valley #AI research
1주 전 · ai · - · -

Google의 새로운 Gemini Pro 모델이 다시 한 번 기록적인 벤치마크 점수를 기록했습니다

!Google Gemini https://techcrunch.com/wp-content/uploads/2026/01/google-gemini-jagmeet-singh-techcrunch.jpg?w=1024 이미지 출처: Jagmeet Singh / TechCrunch Goog...

#Google #Gemini #LLM #large language model #benchmark #AI research #machine learning
1주 전 · ai · - · -

Google의 새로운 Gemini Pro 모델이 기록적인 벤치마크 점수 — 다시

!Google Gemini 이미지 출처: Jagmeet Singh / TechCrunch In B...

#Google #Gemini #LLM #large language model #benchmark scores #AI research #machine learning
2주 전 · ai · - · -

연구: Self-generated Agent Skills는 무용지물이다

저자: Xiangyi Li https://arxiv.org/search/cs?searchtype=author&query=Li,+X, Wenbo Chen https://arxiv.org/search/cs?searchtype=author&query=Chen,+W, Yimin Liu …

#self-generated skills #agent-based learning #skill discovery #reinforcement learning #AI research #arxiv
2주 전 · ai · - · -

선형 표현과 중첩

LLM이 점점 더 커지고, 더 능력 있어지고, 더 널리 퍼짐에 따라, mechanistic interpretability(https://en.wikipedia.org/wiki/Mechanistic_interpretability) 분야는—

#mechanistic interpretability #linear representation hypothesis #superposition #LLM #transformer circuits #AI research
2주 전 · ai · - · -

중간에 길을 잃다: 더 큰 컨텍스트 윈도우가 항상 LLM 성능을 향상시키는 것은 아니다

개요: 모든 것을 하나의 긴 프롬프트에 넣고 작동하기를 기대하는 것은 일반적인 관행이지만, 종종 역효과를 낳습니다. 더 많은 컨텍스트를 추가하면 실제로 성능이 저하될 수 있습니다...

#LLM #context windows #prompt engineering #AI research #long context performance
3주 전 · ai · - · -

Nvidia의 새로운 기술, 정확도 손실 없이 LLM 추론 비용을 8배 절감

Dynamic Memory Sparsification DMS NVIDIA 연구원들은 Dynamic Memory Sparsification DMS를 도입했으며, 이 기술은 대규모…

#Nvidia #large language models #dynamic memory sparsification #KV cache compression #LLM reasoning efficiency #memory optimization #AI research
3주 전 · ai · - · -

RAG란? Retrieval‑Augmented Generation 설명

TL;DR RAG Retrieval‑Augmented Generation은 언어 모델과 실시간 데이터 검색을 결합하여 정확하고 최신의 응답을 제공합니다. 주요 장점: …

#retrieval-augmented generation #RAG #large language models #LLM #hallucination reduction #knowledge retrieval #AI research
3주 전 · ai · - · -

지난달에 배운 머신러닝 교훈

전년과 마찬가지로 전 세계에 불꽃놀이가 터졌다. 사람들은 새해를 새로운 결심과 목표로 맞이했다. 어딘가에 누군가가 분명히 이렇게 말했을 것이다: “2026은…

#machine learning #ICML #research productivity #deadline season #flow state #data science #AI research

Newer posts

Older posts