这是什么?
UN Web TV Transcripts 是一个处于公开预览阶段的工具,可从发布在 联合国网络电视 (在新标签页中打开) 上的联合国会议录像中自动生成可搜索的转录文本。
面向谁?
本工具旨在帮助任何需要快速获取联合国会议口头内容的人,包括:
- 在多个机构间跟踪会议工作的外交官和代表团工作人员
- 研究联合国辩论和表决记录的研究人员和学者
- 报道联合国事务的记者
- 关注政策讨论的民间社会组织
- 审阅会议记录的联合国秘书处工作人员
涵盖哪些会议?
本工具涵盖在联合国网络电视上录制并发布的公开会议,包括:
- 安全理事会 — 公开会议和通报会
- 大会 — 全体会议和主要委员会会议
- 人权理事会
- 经济及社会理事会
- 网络电视上可获取的其他政府间机构
闭门或秘密会议不会在网络电视上录制,因此不在本工具的涵盖范围内。
工作原理
1
收集会议日程
系统监测联合国网络电视上新发布的会议录像。会议元数据 — 标题、日期、联合国机构和相关文件参考 — 从网络电视网站提取并存储。
2
音频转录
我们直接转录现有的联合国音频频道 — 原始的「现场」声道和每一种联合国官方口译声道。不进行机器翻译。每个声道由针对该语言选定的语音识别模型进行转录。
3
发言者识别
转录完成后,第二个 AI 模型会分析文字和音频,在可能的情况下为每位发言者标注姓名和所属。它使用上下文线索 — 主席介绍代表、提及国家名称、说话人分离 — 并结合可获得的正式与会者名单。
4
主题分析
系统自动分析转录文本,识别讨论的主要政策主题,并使用与联合国工作相关的类别(例如人道主义事务、国际和平与安全、人权)。
5
对照官方记录
如果存在官方逐字记录或简要记录(PV/SR 文件),系统会获取它们并添加时间戳以将文本与视频对齐。除时间戳外,这些文件不进行任何 AI 处理。
准确性与局限
这些转录由自动语音识别生成,并非联合国正式记录。
它们是更快速的非官方参考,可用于跟踪和研究,但不应作为权威引用。如需正式记录,请参阅联合国正式文件系统 (在新标签页中打开)(逐字记录、简要记录和决议)。
自动转录比人工转录快得多,但会产生人工审校能够发现的错误。常见问题包括:
- 专有名词 — 国家名称、代表姓名、地名以及联合国文件编号可能被听错或拼错
- 技术术语 — 联合国实践中的法律或程序用语可能被错误地转录
- 有口音的发言 — 准确性因发言者口音和麦克风质量而异
- 重叠发言 — 多人同时发言时,归属可能出错
数据来源
- 联合国网络电视 — 会议录像和元数据,通过 Kaltura 媒体平台提供(公开访问地址为 webtv.un.org)。
- 联合国正式文件系统 — 从 documents.un.org 检索的正式逐字记录(PV 文件,凡可获取者)。
状态
本工具处于公开预览阶段。功能、覆盖范围和准确性正在持续改进。欢迎反馈。