나는 14개의 인기 있는 AI 프레임워크를 행동 약속 기준으로 평가했다 — 여기 데이터가 있다

발행: 1개월 전 (2026년 4월 5일 오전 05:41 GMT+9)

5 분 소요

원문: Dev.to

Source: Dev.to

방법론

가짜가 어렵게 만드는 다섯 가지 행동 신호, 가중치 부여:

신호	가중치	논리
장기성	30%	일관된 운영 연수
최근 활동	25%	최근 30일간 커밋
커뮤니티	20%	기여자 수
릴리스 주기	15%	안정적인 버전 릴리스
사회적 증거	10%	스타(실제 사용자가 별을 줘서 주목을 끔)

보관된 저장소 또는 2년 이상 푸시가 없는 프로젝트는 50% 감점됩니다.

결과

Framework	점수	연령	30일 커밋	스타
🥇 openai/openai-python	95/100	5.4 yr	28	30k
🥇 deepset-ai/haystack	95/100	6.4 yr	100	25k
🥈 langchain-ai/langchain	92/100	3.5 yr	100	132k
🥈 run-llama/llama_index	92/100	3.4 yr	100	48k
🥈 agno-agi/agno	92/100	3.9 yr	100	39k
🥉 anthropics/anthropic-sdk-python	90/100	3.2 yr	54	3k
microsoft/semantic-kernel	87/100	3.1 yr	32	28k
huggingface/transformers	85/100	7.4 yr	100	159k
BerriAI/litellm	84/100	2.7 yr	100	42k
pydantic/pydantic-ai	84/100	1.8 yr	93	16k
stanfordnlp/dspy	82/100	3.2 yr	32	33k
google/adk-python	79/100	1.0 yr	100	19k
crewAIInc/crewAI	74/100	2.4 yr	100	48k
microsoft/autogen	67/100	2.6 yr	2	57k

눈에 띄는 점

microsoft/autogen은 이례적입니다: 57 k 스타를 보유했지만 최근 30 일 동안 2개의 커밋만 있었으며, 점수는 67입니다. 높은 스타 수는 과거 인기를 반영하지만, 최근 활동이 적은 것은 순수한 소셜‑프루프 지표만으로는 놓칠 수 있는 차이를 보여줍니다.
huggingface/transformers는 가장 오래된 프로젝트(7.4 yr)임에도 점수 85를 기록합니다. 50 % 아카이브‑프로젝트 페널티는 오래 됨만으로 점수가 부풀려지는 것을 방지하며, 최근 활동도 여전히 중요합니다.
pydantic/pydantic-ai(1.8 yr)는 84점—2년 미만 프로젝트 중 가장 높은 점수—을 기록했으며, 이는 강력한 실적을 가진 팀이 최근 30 일 동안 93개의 커밋을 수행했기 때문입니다.
crewAIInc/crewAI는 48 k 스타와 월 100개의 커밋을 보유하고 있지만, 점수는 74에 불과합니다. 이는 릴리스‑주기 요소가 안정적인 버전 릴리스 없이 자주 배포하는 프로젝트에 페널티를 부여하기 때문이며, 이러한 설계 선택은 빠른 반복과 명확한 버전 관리 사이의 트레이드‑오프를 강조합니다.

더 깊은 의미

별과 문서는 콘텐츠—만들기 쉽고 해석하기 어렵다.

커밋 히스토리, 릴리스 주기, 그리고 기여자 성장은 커밋먼트—실제 사람들의 실시간 노력이 필요하고 대규모로 위조하기 어렵다.

이것이 Proof of Commitment 의 전제로, AI 에이전트와 인간이 누구를, 무엇을 신뢰할지 결정할 때 행동 기반 신뢰 계층을 제공한다.

직접 해보세요

점수 매기기 도구는 MCP 서버로 제공됩니다. 설치 없이 바로 사용:

{
  "mcpServers": {
    "proof-of-commitment": {
      "type": "streamable-http",
      "url": "https://poc-backend.amdal-dev.workers.dev/mcp"
    }
  }
}

그런 다음 Claude, Cursor 또는 any MCP client에 요청하세요:

“다음 의존성들의 점수를 매겨 주세요: langchain-ai/langchain, BerriAI/litellm, run-llama/llama_index”

lookup_github_repo 도구는 모든 공개 GitHub 저장소에서 작동합니다. Source: github.com/piiiico/proof-of-commitment

레포 커밋 점수에 무엇을 추가하고 싶으신가요? 저는 이슈 응답 시간, 의미 버전 관리 준수, 보안 권고 대응 등을 생각하고 있습니다. 의존성을 평가할 때 여러분에게 중요한 것은 무엇인가요?

나는 14개의 인기 있는 AI 프레임워크를 행동 약속 기준으로 평가했다 — 여기 데이터가 있다

방법론

결과

눈에 띄는 점

더 깊은 의미

직접 해보세요

관련 글

왜 나는 무료 오픈소스 AWS emulator를 만들고 있는가

이것은 DEV April Fools Challenge에 대한 제출입니다.

서버 관리 그만하기: AWS에서 확장 가능한 서버리스 데이터 레이크 구축

Anthropic가 OpenClaw를 금지하고 내 AI Stack을 파괴한 날 (그리고 내가 다시 구축한 방법)