Instagram Reel 转录仅5行 — 词级时间戳免费
发布: (2026年5月2日 GMT+8 12:54)
4 分钟阅读
原文: Dev.to
Source: Dev.to
Instagram 大规模转录的价格陷阱
如果你曾经为 Instagram 转录进行大规模定价,你已经知道这个陷阱:SaaS 版的按视频计费,加上词级时间戳的额外费用。对 500 条 Reel 进行计算,成本很快就变得不可承受。
我并不是想劝你不要自行搭建流水线——我只是展示在不想额外付费时我会运行的五行代码。
2026 年典型的 API 定价
- 每处理一个视频的基础费率。
- 有时还有每分钟音频的单独费率。
- 为提供 词级时间戳(字幕、搜索或剪辑编辑器必需)收取额外费用。
这种模式适用于单个创作者的库,但在为数百甚至数千个 Reel、多个客户的代理机构处理时就失效了。
使用 Apify 的免费、无限制方案
from apify_client import ApifyClient
client = ApifyClient("YOUR_APIFY_TOKEN")
run = client.actor("sian.agency/instagram-ai-transcript-unlimited").call(
run_input={
"bulkUrls": ["https://www.instagram.com/reel/DG06PnPT9aT/"],
"wordLevelTimestamps": True,
}
)
print(next(client.dataset(run["defaultDatasetId"]).iterate_items())["transcript"])
实际需要的三个输入字段
| 字段 | 类型 | 描述 |
|---|---|---|
instagramUrl | string | 单个 Reel 或视频帖子。强制匹配模式;/reels/ 会自动纠正为 /reel/。 |
bulkUrls | array | 粘贴 1 条 URL、1 000 条 URL、上传 .txt 文件,或手动提供列表。无论数量多少形状相同。 |
wordLevelTimestamps | boolean (默认 true) | 为每个转录返回词级时间戳。免费——无额外费用。 |
第三个字段正是本文的重点:它默认启用,而大多数工具会把它隐藏在付费墙后面。
需要处理的约束
- 图片轮播 – 没有音频,无法转录。
- 仅音乐视频 – 没有语音音频,转录将为空。
- 私密账号 – Instagram 会阻止抓取私密内容;该 actor 仅处理公开的 Reel 和帖子。
如果你在构建“抓取任意 Instagram URL”功能,必然会遇到这些边缘情况。actor 会对每个 URL 返回明确的错误,你可以在客户端侧处理并静默跳过。
Apify actor 的计费模型
- 对已验证的 URL 不收取费用。
- 收费基于 每次运行的计算时间。
- 将 1 000 条 Reel 放在一次批处理中算作一次运行。
因此批量处理既能降低成本,又能加快处理速度,因为运行时队列保持热状态。
实际成本对比
| 设置 | 每 500 条 Reel 的成本 |
|---|---|
| 旧的按视频 API($0.05 + $0.02 时间戳费) | $35 |
| 新的批量运行(Apify) | ≈ $8–$9(约为原成本的 1/4) |
数据集结构保持一致,但新方法更可预测且更经济。
亲自尝试
- 单 URL 测试 – 花费不到一杯咖啡。
- 批量运行 – 无限。
如果你发现公共 Reel 的 URL 格式有遗漏,请在评论中提出;维护者会在下一个构建中修复。