[Paper] PubMed-OCR: PMC 오픈 액세스 OCR 주석
PubMed-OCR는 PubMed Central Open Access PDF에서 파생된 과학 논문들의 OCR 중심 코퍼스입니다. 각 페이지 이미지에는 Google Cloud Vision을 사용하여 주석이 달려 있습니다.
PubMed-OCR는 PubMed Central Open Access PDF에서 파생된 과학 논문들의 OCR 중심 코퍼스입니다. 각 페이지 이미지에는 Google Cloud Vision을 사용하여 주석이 달려 있습니다.
맥락 및 동기. 온라인 사용자 피드백은 요구사항 엔지니어링에 귀중한 자원이지만, 그 양과 잡음 때문에 분석이 어렵다. 기존 too...
3차원 빈 패킹 문제(3D‑BPP)는 operations research와 logistics 분야에서 오랫동안 지속되어 온 도전 과제입니다. Classical heuristics와 constructive methods…
GitHub는 GitHub Actions를 통해 워크플로 자동화를 기본적으로 지원합니다. 그러나 워크플로 유지관리는 종종 소프트웨어 개발자에게 부담으로 여겨지며, 이들은 자주…
신경 가소성에서 영감을 받은 비지도 학습 방법을 활용하는 스파이킹 신경망(SNN)은 인공지능을 위한 새로운 프레임워크가 될 것으로 기대된다.
Function-as-a-Service(FaaS)는 서버리스 클라우드 컴퓨팅에서 핵심 패러다임이 되었지만, FaaS 배포를 최적화하는 것은 여전히 어려운 과제입니다. Using function fu...
우리는 봇이 이더리움 생태계의 오픈소스 토론에 어떻게 기여하고 개발자의 감정적 톤에 영향을 미치는지 연구합니다. 우리의 데이터셋은 36,8…
Large Language Models (LLMs)이 자율 에이전트로 진화하면서 AI 코딩의 범위가 국지적인 코드 생성에서 복잡한, 저장소 기반 …
고차원 포트폴리오 최적화는 복잡한 제약 하에서 상당한 계산상의 도전에 직면하고 있으며, 전통적인 최적화 방법은 이를 해결하는 데 어려움을 겪고 있다…
대규모 다중 사용자 온라인(MMO) 게임 서버는 수천 명의 동시 플레이어를 처리하면서 100ms 미만의 응답 시간을 유지해야 합니다. 서버 부하가 초과될 때...
소프트웨어는 지속적으로 진화하고 있으며, 개발자들은 새로운 기능을 도입하거나 버그를 수정하기 위해 자주 풀 리퀘스트(PR)를 제출합니다. PR을 테스트하는 것은 …에 중요합니다.
네트워킹은 소프트웨어 엔지니어링 연구와 연구자들의 성장 및 가시성에 핵심적입니다. 그러나 이러한 네트워크를 구축할 기회와 역량은…
정적 애플리케이션 보안 테스트(SAST) 도구가 오염 분석(taint analysis)을 사용할 경우, ...에 비해 더 높은 품질의 취약점 탐지 결과를 제공하는 것으로 널리 인식되고 있다.
맥락: Self-admitted technical debt (SATD)는 개발자가 코드에서 단축을 인정할 때 발생합니다. 과학 소프트웨어(SSW)에서는 이러한 부채가 고유한 위험을 초래합니다...
우리는 카메라와 객체가 모두 움직이는 동적 환경에서 새로운 시점 합성(NVS)을 위한 자체 감독 프레임워크인 WildRayZer를 제시한다. 동적 콘텐츠…
우리는 차별화 가능한(differentiable) 그리드 기반(grid‑based) 표현을 제시하여 미분 방정식(DEs)을 효율적으로 해결한다. 신경 솔버(neural solvers)에 널리 사용되는 아키텍처, ...
우리는 이미지에서 객체의 내재적 속성을 편집하기 위한 diffusion 기반 방법인 Alterbute를 소개합니다. 색상, 질감, 재료 등을 변경할 수 있으며, ...
Tool-Integrated Reasoning (TIR)은 대형 언어 모델(LLMs)이 추론 단계와 외부 도구 상호작용을 교차시켜 복잡한 작업을 수행하도록 지원합니다.
Vision-Language Models (VLMs)는 시각 인코더의 출력만을 연결하는 조잡하고 비대칭적인 연결을 사용함으로써 심각한 visual feature bottleneck을 초래한다.
Diffusion models는 풍부한 multi-modal distributions에서 샘플링하는 데 놀라운 경험적 성공을 보여왔습니다. 그들의 추론은 특정을 수치적으로 해결하는 데 의존합니다.
최근 엔드투엔드 자율주행 분야의 진보는, 파운데이션 모델에서 추출한 패치 정렬 특징을 사용해 훈련된 정책이 Out-...에 대해 더 잘 일반화한다는 것을 보여준다.
우리는 반복 파라미터 혼합(IPM 스타일 평균화)을 통해 훈련되는 반비동기 클라이언트‑서버 퍼셉트론을 연구한다: 클라이언트는 로컬 퍼셉트론 업데이트를 수행하고 a s...
대규모 언어 모델을 long-horizon, goal-oriented interactions에 배치하는 것은 여전히 어려운 과제이다. 이는 유사한 엔터티와 사실이 서로 다른 latent …
Federated learning은 여러 당사자가 자체 원시 데이터를 공유하지 않고 학습 모델을 공동으로 훈련할 수 있게 하여, 프라이버시…