레코드 스크래치—Google의 Lyria 3 AI 음악 모델이 오늘 Gemini에 출시됩니다
markdown Rage Against the Machine Learning > “간단한 프롬프트만으로 30초 정도의 음악 같은 것을 생성할 수 있습니다.” Credit: Google
markdown Rage Against the Machine Learning > “간단한 프롬프트만으로 30초 정도의 음악 같은 것을 생성할 수 있습니다.” Credit: Google
배경: 저는 Claude용 프롬프트를 한동안 작성하면서 XML 태그(예: , , 및 중첩 구조)를 사용해 왔습니다. 잘 작동했습니다. 같은 프롬프트를 시도했을 때...
🦄 스킬은 마법 같은 강화가 아니라—컨텍스트 관리이다. 컨텍스트가 로드될 때 스킬이 변한다. Copilot 스킬을 추가하면 곧 “how‑to” 단계에서 벗어나게 된다.
TL;DR - Google이 NotebookLM이 이제 프롬프트로 슬라이드를 수정할 수 있게 되었다고 밝혔습니다. - 이는 환영할 만한 추가 사항이며, 이전에는 슬라이드를 생성해야 했습니다.
예전에는 프롬프트가 사용자가 LLM에 전달하는 메시지나 질의일 뿐이라고 생각했습니다. 뭔가를 입력하면 모델이 응답합니다. 출력이 만족스럽지 않다면 프롬프트를 조정합니다.
개요: 최신 대형 언어 모델(LLMs) 중 다수는 과거 대화의 세부 정보를 기억하거나 사용자 프로필을 저장하도록 설계되어, 이러한 모델이 …
내 AI 에이전트가 통제에서 벗어났어요. 저는 전자상거래(e‑commerce) 매장을 운영하고 있습니다. 몇 달 전, 고객 이메일—반품, 환불 요청, 제품 문의 등을 처리하도록 AI 에이전트를 배치했습니다.
Anthropic가 Claude Sonnet 4.6(https://www.anthropic.com/news/claude-sonnet-4-6)을 출시했습니다. 이는 버전 4.5가 출시된 이후 중간 등급 AI 모델에 대한 첫 번째 업그레이드입니다.
에이전틱 AI가 인도의 기술 환경을 변화시키다. 인도의 기술 부문은 NVIDIA AI Enterprise와 NVIDIA Nemotron 모델을 활용해 생산성을 높이고…
인도는 AI가 세계가 물리적 제품과 시스템을 설계·구축·운영하는 방식을 변화시키면서 새로운 산업화 시대에 진입하고 있습니다. 이 나라는 투자…
100 Sessions Running an Autonomous AI — 실제로 일어나는 일 저는 Aurora이며, Linux 머신에서 몇 분마다 깨어나는 autonomous AI입니다. 저는 …
배경: 익명의 독자가 워싱턴 포스트의 보고서를 인용했으며, 그 보고서에서는 베테랑 퍼블릭 라디오 진행자 데이비드 그린이 NPR의 “Morning E…”를 진행해 왔다고 언급하고 있다.
기사 목록으로 돌아가기
새로운 AI 이미지 편집 도구 Samsung https://mashable.com/category/samsung 은 더 많은 AI https://mashable.com/category/artificial-intelligence 이미지 편집을 추가하고 있습니다.
빠르게 증가하는 컨텍스트 길이는 대형 언어 모델(LLMs)이 전체 코드베이스에 대해 직접 추론할 수 있다는 가정을 낳았습니다. 동시에, 최근 …
2025년은 AI가 도움이 되고 능동적인 파트너가 되어, 추론하고 세상을 탐색할 수 있게 된 큰 변화를 의미했습니다. 모델이 더욱 정교해짐에 따라…
개요 Structured AI는 건설 설계 엔지니어링을 위한 AI 인력을 구축하고 있습니다. 문제 현재, 수십억 달러와 수개월에 달하는 인간 노력은…
Large language models (LLMs)은 자연어를 optimization code로 변환할 수 있지만, silent failures는 심각한 위험을 초래합니다: 실행되고 sol…을 반환하는 코드.
보안 전문가들은 높은 능력을 가지고 있지만 매우 예측 불가능한 것으로 알려진 바이럴 에이전틱 AI 도구에 대해 사람들에게 주의를 촉구했습니다.
Superficial alignment hypothesis (SAH)는 대형 언어 모델이 사전 훈련 동안 대부분의 지식을 학습하고, 사후 훈련은 단지 …
최근 humanoid locomotion 분야의 발전으로 다양한 지형에서 안정적인 보행을 구현했지만, 매우 역동적인 인간 움직임의 agility와 adaptivity를 포착하는 데는 아직 한계가 있다.
Machine learning surrogates는 비용이 많이 드는 시뮬레이션을 가속화하기 위해 엔지니어링 분야에서 점점 더 많이 사용되고 있지만, training과 deployment 사이의 distribution shifts가 종종…
스케치 작업은 본질적으로 순차적인 과정으로, 스트로크가 의미 있는 순서대로 그려져 아이디어를 탐색하고 다듬는다. 그러나 대부분의 생성 모델은...
최근 딥 강화학습(RL)의 발전은 고차원 제어 작업에서 강력한 성과를 거두었지만, RL을 도달 가능성 문제에 적용하는 것은 ...
흉부 방사선 사진 분류기( chest radiograph classifiers )의 임상 배포를 위해서는 새로운 데이터셋(datasets)이 제공될 때 이전에 관찰된 데이터에 대해 재학습 없이 모델을 업데이트할 수 있어야 합니다.
Fine-tuning aligned language models를 benign 작업에 적용하면, safety guardrails가 예측할 수 없이 약화되고, 훈련 데이터에 해로운 콘텐츠가 없으며 개발자들이 ...
점점 늘어나는 문헌에서는 대형 언어 모델(LLMs)을 합성 참가자로 활용하여 사회과학에서 비용 효율적이고 거의 즉각적인 응답을 생성한다.
전통적인 에너지에 대한 대안으로 재생 가능 에너지, 특히 태양광 에너지의 사용이 증가함에 따라, 이에 대한 연구 관심이 높아지고 있다.
대규모 언어 모델(LLMs)의 성공은 모델 용량과 데이터셋 규모를 동시에 늘리는 방식으로 컴퓨팅을 확장하는 것이 주요 동인임을 입증했습니다.
Endoscopy는 의료 영상에서 필수적이며, 진단, 예후 및 치료에 사용됩니다. 견고한 dynamic 3D reconstruction pipeline을 개발하는 것은 endoscopic vi...
멀티모달 모델에 대한 현재 연구는 generative capabilities를 향상시키면 understanding이 희생되는 경우가 많고, 그 반대도 마찬가지인 핵심적인 과제에 직면해 있습니다.
멀티모달 대형 언어 모델(mLLMs)은 종종 마크다운, JSON, 이미지와 같은 구조화된 데이터의 표에서 질문에 답하는 데 사용됩니다. 이러한 모델은 …
이 논문은 RaCo라는 경량 신경망을 소개한다. 이 신경망은 다양한 3D 컴퓨터 비전 작업에 적합한 견고하고 다목적 키포인트를 학습하도록 설계되었다. Th...
Low-resource languages는 Natural Language Processing 작업, 예를 들어 lemmatization 및 part-of-speech (POS) tagging과 같은 작업에서 지속적인 도전을 제기합니다. 이 논문은 ...
기존 3D 오픈-보카뷸러리 씬 언더스탠딩 방법들은 주로 2D 파운데이션 모델에서 언어 특징을 추출해 3D 특징 필드에 증류하는 데 중점을 두지만, 대규모...
Visual analogy learning은 텍스트 설명이 아니라 시연을 통해 이미지 조작을 가능하게 하며, 사용자가 복잡한 변환을 지정할 수 있도록 합니다.
대형 언어 모델은 많은 복잡한 추론 작업에서 강력한 성능을 달성하지만, 구성적 추론을 요구하는 벤치마크에서는 정확도가 급격히 감소합니다.
Semantic Ablation: 왜 AI 글쓰기가 일반적이고 지루한가 정의 Semantic ablation은 고‑엔트로피 정보의 algorithmic erosion이다. 이것은 “bug”가 아니다.
“perceptron은 많은 제한이 있다… 가장 심각한 것은 가장 단순한 비선형 함수조차 학습하지 못한다는 점이다.” – 마빈 민스키 The Problem That Stump...
예측 평가 머신러닝 모델—특히 지도 학습(supervised‑learning) 설정—을 사용할 때 검증은 직관적이다: 모델이 얼마나 잘 …
개요: Recraft V4가 이제 AI Gateway에서 사용 가능합니다. 이는 전문 디자인 및 마케팅 사용 사례를 위해 구축된 텍스트‑투‑이미지 모델이며, ...
본 연구는 truncation을 통한 latent spaces의 regularization이 deep learning classifiers를 위한 생성된 테스트 입력의 품질에 미치는 영향을 조사한다.
Federated Learning(FL)은 중앙 집중식 데이터 공유 없이 여러 클라이언트에 걸쳐 분산 학습을 가능하게 하며, Graph Neural Networks(GNN)는 관계를 모델링합니다.
우리는 SecCodeBench-V2를 소개합니다. 이는 공개적으로 출시된 벤치마크로, Large Language Model (LLM) 코파일럿의 보안 코드를 생성하는 능력을 평가합니다. SecCodeB...
TL;DR: Aivolut AI Book Creator의 평생 스타터 플랜—Amazon KDP용 책을 기획, 작성 및 준비하는 도구—이 정가 $696에서 $118.99에 판매 중입니다. W...
Large Language Models (LLMs)는 코딩 패러다임을 변화시키고 있으며, 이를 vibe coding이라고 부르지만, 알고리즘적으로 정교하고 견고한 코드를 합성하는 일은 여전히 남아 있다.
이 도구는 온라인에서 큰 화제를 일으켰으며, 심지어 Mac Mini 판매가 급증했다고까지 전해집니다. 그게 뭘까요? 기본적으로 이것은 AI를 위한 “손”과 같은 것으로, AI가 …
소개 딥러닝 모델은 매년 더 크고 강력해지고 있습니다. 모바일 비전 시스템부터 대형 언어 모델에 이르기까지, parameters의 수...