나는 14개의 인기 있는 AI 프레임워크를 행동 약속 기준으로 평가했다 — 여기 데이터가 있다

발행: (2026년 4월 5일 AM 05:41 GMT+9)
5 분 소요
원문: Dev.to

Source: Dev.to

방법론

가짜가 어렵게 만드는 다섯 가지 행동 신호, 가중치 부여:

신호가중치논리
장기성30%일관된 운영 연수
최근 활동25%최근 30일간 커밋
커뮤니티20%기여자 수
릴리스 주기15%안정적인 버전 릴리스
사회적 증거10%스타(실제 사용자가 별을 줘서 주목을 끔)

보관된 저장소 또는 2년 이상 푸시가 없는 프로젝트는 50% 감점됩니다.

결과

Framework점수연령30일 커밋스타
🥇 openai/openai-python95/1005.4 yr2830k
🥇 deepset-ai/haystack95/1006.4 yr10025k
🥈 langchain-ai/langchain92/1003.5 yr100132k
🥈 run-llama/llama_index92/1003.4 yr10048k
🥈 agno-agi/agno92/1003.9 yr10039k
🥉 anthropics/anthropic-sdk-python90/1003.2 yr543k
microsoft/semantic-kernel87/1003.1 yr3228k
huggingface/transformers85/1007.4 yr100159k
BerriAI/litellm84/1002.7 yr10042k
pydantic/pydantic-ai84/1001.8 yr9316k
stanfordnlp/dspy82/1003.2 yr3233k
google/adk-python79/1001.0 yr10019k
crewAIInc/crewAI74/1002.4 yr10048k
microsoft/autogen67/1002.6 yr257k

눈에 띄는 점

  • microsoft/autogen은 이례적입니다: 57 k 스타를 보유했지만 최근 30 일 동안 2개의 커밋만 있었으며, 점수는 67입니다. 높은 스타 수는 과거 인기를 반영하지만, 최근 활동이 적은 것은 순수한 소셜‑프루프 지표만으로는 놓칠 수 있는 차이를 보여줍니다.
  • huggingface/transformers는 가장 오래된 프로젝트(7.4 yr)임에도 점수 85를 기록합니다. 50 % 아카이브‑프로젝트 페널티는 오래 됨만으로 점수가 부풀려지는 것을 방지하며, 최근 활동도 여전히 중요합니다.
  • pydantic/pydantic-ai(1.8 yr)는 84점—2년 미만 프로젝트 중 가장 높은 점수—을 기록했으며, 이는 강력한 실적을 가진 팀이 최근 30 일 동안 93개의 커밋을 수행했기 때문입니다.
  • crewAIInc/crewAI는 48 k 스타와 월 100개의 커밋을 보유하고 있지만, 점수는 74에 불과합니다. 이는 릴리스‑주기 요소가 안정적인 버전 릴리스 없이 자주 배포하는 프로젝트에 페널티를 부여하기 때문이며, 이러한 설계 선택은 빠른 반복과 명확한 버전 관리 사이의 트레이드‑오프를 강조합니다.

더 깊은 의미

별과 문서는 콘텐츠—만들기 쉽고 해석하기 어렵다.

커밋 히스토리, 릴리스 주기, 그리고 기여자 성장은 커밋먼트—실제 사람들의 실시간 노력이 필요하고 대규모로 위조하기 어렵다.

이것이 Proof of Commitment 의 전제로, AI 에이전트와 인간이 누구를, 무엇을 신뢰할지 결정할 때 행동 기반 신뢰 계층을 제공한다.

직접 해보세요

점수 매기기 도구는 MCP 서버로 제공됩니다. 설치 없이 바로 사용:

{
  "mcpServers": {
    "proof-of-commitment": {
      "type": "streamable-http",
      "url": "https://poc-backend.amdal-dev.workers.dev/mcp"
    }
  }
}

그런 다음 Claude, Cursor 또는 any MCP client에 요청하세요:

“다음 의존성들의 점수를 매겨 주세요: langchain-ai/langchain, BerriAI/litellm, run-llama/llama_index”

lookup_github_repo 도구는 모든 공개 GitHub 저장소에서 작동합니다. Source: github.com/piiiico/proof-of-commitment

레포 커밋 점수에 무엇을 추가하고 싶으신가요? 저는 이슈 응답 시간, 의미 버전 관리 준수, 보안 권고 대응 등을 생각하고 있습니다. 의존성을 평가할 때 여러분에게 중요한 것은 무엇인가요?

0 조회
Back to Blog

관련 글

더 보기 »