EUNO.NEWS EUNO.NEWS
  • All (20335)
  • AI (3102)
  • DevOps (910)
  • Software (10501)
  • IT (5776)
  • Education (45)
  • Notice (1)
  • All (20335)
    • AI (3102)
    • DevOps (910)
    • Software (10501)
    • IT (5776)
    • Education (45)
  • Notice (1)
  • All (20335)
  • AI (3102)
  • DevOps (910)
  • Software (10501)
  • IT (5776)
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 2개월 전 · ai

    [Paper] Dyna‑Q 강화학습을 위한 예측 안전 방패

    강화 학습에 대한 안전 보증을 확보하는 것은 실제 작업에 적용 가능성을 달성하기 위한 주요 과제입니다. 안전 방패는 표준 강화 학습 에이전트에 추가적인 보호 계층을 제공하여, 에이전트가 환경과 상호 작용할 때 사전에 정의된 안전 제약을 위반하지 않도록 보장합니다. 이러한 방패는 일반적으로 사전 학습된 모델이나 런타임 검증 메커니즘을 활용하여, 위험한 행동이 실행되기 전에 이를 차단하거나 안전한 대체 행동으로 교체합니다. 이 접근 방식은 특히 안전이 중요한 로봇 공학, 자율 주행, 의료 및 산업 자동화와 같은 분야에서 유용합니다. 방패는 에이전트가 탐색 과정에서 발생할 수 있는 예기치 않은 위험을 최소화하면서도, 학습 효율성을 크게 저해하지 않도록 설계되어야 합니다. 핵심 아이디어는 다음과 같습니다. 1. **안전 제약 정의**: 환경에서 허용 가능한 행동 집합을 명시적으로 규정합니다. 2. **실시간 검증**: 에이전트가 선택한 행동이 안전 제약을 만족하는지 실시간으로 검사합니다. 3. **대체 행동 생성**: 안전 제약을 위반하는 경우, 안전한 대체 행동을 자동으로 생성하거나 기존 안전 정책에 따라 행동을 수정합니다. 4. **학습 통합**: 방패 메커니즘을 강화 학습 알고리즘에 통합하여, 에이전트가 안전한 행동을 지속적으로 학습하도록 유도합니다. 이러한 안전 방패는 강화 학습 시스템이 실제 세계에 적용될 때 발생할 수 있는 위험을 크게 감소시켜, 보다 신뢰할 수 있는 인공지능 솔루션을 구현하는 데 기여합니다.

    #research #paper #ai #machine-learning
  • 2개월 전 · ai

    [Paper] 비균일 시간 간격에서 특성 제약을 이용한 연령별 알츠하이머병 예측

    Alzheimer’s disease는 인지 기능 저하를 특징으로 하는 쇠약해지는 질환입니다. 질병을 시기 적절하게 식별하는 것은 ...

    #research #paper #ai #computer-vision
  • 2개월 전 · ai

    [Paper] √n보다 많은 커뮤니티를 갖는 확률 블록 모델의 위상 전이 (II)

    A fundamental theoretical question in network analysis is to determine under which conditions community recovery is possible in polynomial time in the Stochastic Block Model (SBM).

    #research #paper #ai #machine-learning
  • 2개월 전 · ai

    [Paper] 개방형 수학 질문에 대한 비관적 검증

    The key limitation of the verification performance lies in the ability of error detection. With this intuition we designed several variants of pessimistic verif... 검증 성능의 주요 제한은 오류 탐지 능력에 있습니다. 이러한 직관을 바탕으로 우리는 비관적 검증의 여러 변형을 설계했습니다...

    #research #paper #ai #machine-learning
  • 2개월 전 · ai

    [Paper] 항핵항체 이미지에 대한 자체 페이스 학습

    항핵 항체(ANA) 검사는 루푸스, 쇼그렌 증후군 및 경피증을 포함한 자가면역 질환을 진단하는 데 중요한 방법입니다. 그럼에도 불구하고 그…

    #research #paper #ai #computer-vision
  • 2개월 전 · ai

    Voice, Bias, and Coreference: An Interpretability Study of Gender in Speech Translation **번역:** 음성, 편향 및 상호지시: 음성 번역에서 성별에 대한 해석 가능성 연구

    텍스트와 달리, 음성은 피치와 같은 음향 신호를 통해 화자의 성별과 같은 정보를 전달합니다. 이는 모달리티별 편향 문제를 야기합니다....

    #research #paper #ai #machine-learning #nlp
  • 2개월 전 · ai

    [Paper] Transformer 기반 시계열 분류를 위한 메커니즘 해석 가능성

    Transformer 기반 모델은 시계열 분류를 포함한 다양한 머신러닝 작업에서 최첨단 도구가 되었지만, 그 복잡성 때문에 …

    #research #paper #ai #machine-learning
  • 2개월 전 · ai

    [Paper] IntAttention: 완전 정수형 어텐션 파이프라인을 통한 효율적인 엣지 추론

    Transformer 모델을 엣지 디바이스에 배포하는 것은 지연 시간과 에너지 예산에 의해 제한됩니다. INT8 quantization은 기본 행렬 곱셈을 효과적으로 가속화하지만…

    #research #paper #ai #machine-learning
  • 2개월 전 · ai

    [Paper] Tool‑RoCo: Agent‑as‑Tool **자기 조직화** Large Language Model Benchmark in Multi‑robot Cooperation

    Tool‑RoCo는 RoCo(다중 로봇 협업 시스템)를 기반으로 장기적인 다중 에이전트 협력을 평가하기 위해 설계된 새로운 벤치마크로, 대형 언어 모델(LLM)의 성능을 측정한다.

    #research #paper #ai #machine-learning
  • 2개월 전 · software

    [Paper] SV-LIB 1.0: 소프트웨어 검증 작업을 위한 표준 교환 형식

    지난 20년 동안, C, C++와 같은 개별 언어에 대한 검증 도구 개발에 상당한 연구 및 개발 노력이 투자되었습니다.

    #research #paper #software
  • 2개월 전 · ai

    [Paper] 시간 속에 잃어버렸나요? Time-Shift-Tolerant Physiological Signal Transformation을 위한 Meta-Learning 프레임워크

    광용적맥파측정(PPG) 및 볼리스토카디오그래피(BCG)와 같은 비침습 신호를 동맥혈압과 같은 임상적으로 의미 있는 신호로 변환하는…

    #research #paper #ai #machine-learning
  • 2개월 전 · ai

    [Paper] Merge and Bound: 클래스 증분 학습을 위한 가중치 직접 조작

    We present a novel training approach, named Merge-and-Bound (M&B) for Class Incremental Learning (CIL), which directly manipulates model weights in the para... 우리는 클래스 증분 학습(CIL)을 위해 모델 가중치를 직접 조작하는 새로운 학습 접근법인 Merge-and-Bound (M&B)를 제시한다...

    #research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026