EUNO.NEWS EUNO.NEWS
  • All (2755) +65
  • AI (585) +3
  • DevOps (154)
  • Software (1173) +55
  • IT (836) +7
  • Education (6)
  • Notice (1)
  • All (2755) +65
    • AI (585) +3
    • DevOps (154)
    • Software (1173) +55
    • IT (836) +7
    • Education (6)
  • Notice (1)
  • All (2755) +65
  • AI (585) +3
  • DevOps (154)
  • Software (1173) +55
  • IT (836) +7
  • Education (6)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1주 전 · ai

    [Paper] SUPN: 얕은 범용 다항식 네트워크

    딥 뉴럴 네트워크(DNN)와 콜모고로프-아놀드 네트워크(KAN)는 유연성과 표현력 때문에 함수 근사에 널리 사용되는 방법입니다. 최근 연구에서는 KAN이 전통적인 DNN에 비해 더 적은 파라미터로도 복잡한 함수를 효율적으로 모델링할 수 있음을 보여주었습니다. 특히 KAN은 각 레이어에서 다항식 기반 활성화 함수를 사용함으로써, 입력 차원과 출력 차원 사이의 비선형 관계를 보다 직접적으로 캡처합니다. 이러한 특성은 고차원 데이터나 비선형성이 강한 물리 시스템을 모델링할 때 큰 장점을 제공합니다. 또한, KAN은 학습 과정에서 파라미터 초기화와 최적화 전략에 대한 요구사항이 DNN보다 완화되는 경향이 있습니다. 이는 학습 안정성을 높이고, 과적합 위험을 감소시키는 데 기여합니다. 실험 결과에 따르면, 동일한 데이터셋에 대해 KAN은 DNN보다 빠른 수렴 속도와 더 낮은 테스트 오류를 기록했습니다. 요약하면, KAN은 함수 근사 문제에서 DNN을 보완하거나 대체할 수 있는 강력한 대안이며, 특히 파라미터 효율성과 학습 안정성이 중요한 응용 분야에서 큰 잠재력을 가지고 있습니다.

    #research #paper #ai #machine-learning
  • 1주 전 · ai

    [Paper] 주관적 깊이와 시간 스케일 트랜스포머: 언제 어디서 계산할지 학습

    The rigid, uniform allocation of computation in standard Transformer (TF) architectures can limit their efficiency and scalability, particularly for large-scale... → 표준 Transformer (TF) 아키텍처에서의 경직되고 균일한 연산 할당은 특히 대규모...

    #research #paper #ai #machine-learning #nlp
  • 1주 전 · ai

    [Paper] Text-to‑SQL을 이중‑상태 추론으로: 적응형 컨텍스트와 점진적 생성 통합

    Recent divide-and-conquer reasoning approaches, particularly those based on Chain-of-Thought (CoT), have substantially improved the Text-to-SQL capabilities of ... → 최근의 분할‑정복 추론 접근 방식, 특히 체인‑오브‑씽크(Chain-of-Thought, CoT)를 기반으로 한 방식은 Text-to‑SQL 기능을 크게 향상시켰습니다 ...

    #research #paper #ai #nlp
  • 1주 전 · ai

    [Paper] 내성적 행동 훈련: 파인튜닝이 7B 모델에서 신뢰할 수 있는 내부 상태 감지를 유도한다

    Lindsey (2025)는 네 가지 실험을 통해 언어 모델의 내성적 인식을 조사했으며, 모델이 때때로 주입된 …을 감지하고 식별할 수 있음을 발견했습니다.

    #research #paper #ai #machine-learning #nlp
  • 1주 전 · ai

    [Paper] Prune4Web: 웹 에이전트를 위한 DOM 트리 프루닝 프로그래밍

    Web automation employs intelligent agents to execute high-level tasks by mimicking human interactions with web interfaces. Despite the capabilities of recent La... 웹 자동화는 지능형 에이전트를 사용하여 웹 인터페이스와의 인간 상호작용을 모방함으로써 고수준 작업을 수행합니다. 최근 대형 언어 모델(LLM)의 능력에도 불구하고...

    #research #paper #ai #machine-learning #nlp
  • 1주 전 · ai

    [Paper] Monet: 이미지와 언어를 넘어선 잠재 시각 공간에서의 추론

    '이미지를 통한 사고'는 시각적 추론을 발전시키는 효과적인 패러다임으로 떠오르며, 시각적 증거를 삽입함으로써 텍스트만으로 이루어진 사고 사슬을 넘어 확장됩니다.

    #research #paper #ai #machine-learning #computer-vision
  • 1주 전 · software

    [Paper] 대규모 언어 모델을 활용한 유닛 테스트 생성: 성취, 도전 과제, 그리고 앞으로의 길

    Unit testing은 소프트웨어를 검증하고 회귀 위험을 완화하기 위한 필수적이면서도 노동집약적인 기술입니다. 고전적인 자동화 방법은 효과적으로 ...

    #research #paper #software
  • 1주 전 · software

    [Paper] 소프트웨어 공학에서 데이터셋 적응을 위한 다중 에이전트 시스템: 능력, 제한점 및 향후 방향

    소프트웨어 엔지니어링(SE) 연구 산출물을 데이터셋 간에 자동으로 적응시키는 것은 확장성과 재현성을 위해 필수적이지만, 아직도 규모가 크다...

    #research #paper #software
  • 1주 전 · ai

    [Paper] Bounding Boxes와 함께 생각하기: 강화 학습 미세조정을 통한 시공간 비디오 그라운딩 향상

    시공간 비디오 그라운딩(STVG)은 자연어 설명을 기반으로 잘라내지 않은 비디오에서 대상 객체를 시간적으로와 공간적으로 모두 위치 지정해야 합니다....

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] PFF-Net: 포인트 클라우드 노멀 추정을 위한 패치 특징 피팅

    점의 법선을 추정하려면 중심‑주변 컨텍스트를 제공하기 위해 로컬 패치를 구성해야 하지만, 적절한 이웃 크기를 결정하는 것은…

    #research #paper #ai #computer-vision
  • 1주 전 · ai

    [Paper] Hybrid-AIRL: Inverse Reinforcement Learning을 Supervised Expert Guidance와 함께 향상

    Adversarial Inverse Reinforcement Learning (AIRL)은 강화학습(RL)에서 희소 보상 문제를 해결하기 위해 밀도 높은 보상을 추론함으로써 가능성을 보여주었다.

    #research #paper #ai #machine-learning
  • 1주 전 · ai

    [Paper] SurgMLLMBench: 외과 장면 이해를 위한 다중모달 대형 언어 모델 벤치마크 데이터셋

    Recent advances in multimodal large language models (LLMs) have highlighted their potential for medical and surgical applications. However, existing surgical da... 최근 멀티모달 대형 언어 모델(LLM)의 최근 발전은 의료 및 외과 분야에서의 잠재력을 강조하고 있습니다. 그러나 기존 외과 데이터…

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2025