实时:深化交流合作 筑牢AI安全屏障
ChatGPT写文章调代码,文心一言巧解鸡兔同笼数学题,Microsoft 365Copilot帮“打工人”做PPT,Midjourney V5绘制的20世纪90年代中国情侣刷屏朋友圈……人工智能领域的大事一件接着一件,令人欣喜,也引人担忧。担心被AI“抢饭碗”,担心AI发展过快超出人类管控的能力范围。
最近,包括“ChatGPT之父”、OpenAI创始人兼CEO山姆·阿尔特曼,谷歌DeepMind公司CEO戴密斯·哈萨比斯以及美国Anthropic公司的CEO达里奥·阿莫代伊在内的一众AI界大佬联名签署了一封公开信,信的内容很短,加上the和a在内仅有22个单词。字数少,但信息量很大。信中这样说:“与流行病和核战争等其他社会规模的风险一样,缓解人工智能导致的灭绝风险应该被视作全球的优先事项。”信中把AI提到了与流行病和核战争同样的级别,足以见得AI野蛮生长带来的问题的严重性。比如AI系统设计不当或被恶意使用,可能会让歧视和偏见不断固化、虚假信息蔓延、隐私数据泄露……呼吁全球通力合作,对人工智能进行规范与监管,共同去应对、去解决AI超速发展带来的挑战。
上一封著名的AI公开信是在3月底,距离GPT-4发布仅两周时间。包括特斯拉CEO埃隆·马斯克在内的1000多名企业高管、学界专家联署发表公开信,呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统,暂停至少6个月。
(资料图片)
为什么全球顶尖AI公司的高管和学界大咖要呼吁限制AI发展,他们在担心些什么?或许是AI快速发展在带给人们惊喜的同时也带来了未知,有些问题甚至连开发者本身都无能为力。
近日,在2023北京智源大会上,阿尔特曼呼吁全球各方就AI安全问题通力合作,建立国际通行的AI安全标准,并推进人工智能对齐(AI alignment,即引导AI系统的表现,使其符合设计者的预期目标)研究。他提出,可以尝试使用AI系统辅助人类来监督其他AI系统。以未来的AGI(通用人工智能)系统为例,可能包含10万行的二进制代码,人类有必要借助AI来辅助监督,判别系统是否存在违规行为。除了必要性之外,这种方法的好处在于,伴随AI技术的突破,AI监管技术也在同步发展。
在与智源研究院理事长张宏江围绕“AI安全与对齐”议题的问答讨论中,阿尔特曼谈到,未来十年内,全球很可能拥有一个非常强大的AI系统,届时人类会面临很多安全问题,因此,要从现在开始做好准备。他强调,对于AI安全而言,建立统一公平的框架和测试标准,让每个达到一定能力的AI模型都接受测试具有重要意义。他表示,解决AI对齐问题难度极大,需要来自世界各地最好的头脑,并称中国有很多优秀的人工智能人才,期待中国AI研究者能为AI安全提供中国智慧。
请扫码观看视频
划重点!关于AI对齐
什么是AI对齐?
AI对齐(AI alignment)是AI控制问题中的一个主要问题,即要求AI系统的目标要和人类的价值观与利益保持一致。
实现AI对齐面临哪些挑战?
◆ 选择合适的价值观
◆ 将价值观编码到AI系统中,使系统表现与价值观一致
◆ 选择合适的训练数据
AI对齐的研究方法
DeepMind和OpenAI围绕AI对齐分别从“提出合适的价值观”和“用技术方法实现对齐”两方面进行研究。
在用技术方法实现对齐方面,DeepMind提出了一种基于“逆强化学习(Inverse Reinforcement Learning)”的方法,该方法关注人类的行为,能够从行为表现中推断出价值观,并将其编码到AI系统中。OpenAI则提出了一种基于“对抗训练(Adversarial Training)”的方法,通常用于增强模型的鲁棒性和泛化能力,该方法可以让AI系统在与人进行交互时学习到人类的价值观。
逆强化学习的关注点在于人类的行为,从行为表现推断价值观;而对抗训练的重点是交互,从AI系统与人的交互中学习价值观。
关键词:
您可能也感兴趣:
为您推荐
天天热讯:“素质教育”造就“质量奇迹”——湖南省常德市普通高中大面积高质量现象调查(下)
世界聚焦天津!天津准备好了!|最资讯
送老婆生日礼物,让她爱不释手!丙烯酸混色表教你绘制完美画作!
排行
最近更新
- 实时:深化交流合作 筑牢AI安全屏障
- 解放军“轰-6K”逼退美军航母?台退将惊叹:大陆在南海已对美...
- 全国首场预制菜装备产业大会将启幕 “政产学研用金”多元...
- 当前短讯!2023广东舞蹈高考分数线(含2021-2022历年)
- 2023江苏三支一扶考试职位表下载
- 2023上半年河南许昌市第二批教师资格认定体检通知|天天热推荐
- 当前时讯:天际汽车停产后续:新增被执行超5036万
- 李想,在微博“造车”
- 湖南男子找到被拐22年儿子 这些年准备生日礼物26件 今日观点
- 内地顶尖花样游泳队在澳门上演“水上芭蕾”秀
- 河南近15万名考生冲上一本线!“一分一段表”公布…… 当前视讯
- 中山公园对面的万华小区,开出了一片“青春之花”|我爱我家
- 扬州:购买市区改善性住房不再执行限购 人才购房给予契税100...
- 世界速读:新品观察 | 元气森林上新金桂普洱;安慕希推限定雪糕棒
- 东北农业大学发挥专业优势助力乡村振兴——黑土地上绽放科技...
- 当前焦点!川酒集团党委书记、董事长曹勇被授予“四川省优秀企...
- 探秘中国白酒“顶级产区”
- 蕲蛇追风喷剂的功效有哪些?蛇最怕哪3样东西?
- 全球头条:中国动漫博物馆携手阅文推出“经典重现”动漫科普展
- 祝贺!三岔湖小学省级课题成功立项!
- 当前聚焦:一年内水中连救两人,大家保险员工传递保险正能量
- 中国石油天然气集团有限公司原党组副书记、副总经理徐文荣接...
- 地信企业董高监薪酬 一个产业的自画像 天天观察
- 今日播报!海鸥岛有什么地方好玩_海鸥岛有什么好玩的
- 全球关注:3dmaxhdr环境贴图怎么做 3dmaxhdr环境贴图
- 概念动态|中际旭创新增“汽车电子”概念
- 广东高考今日放榜 广州中考顺利收官 他们为18万余考生保驾...
- 大调研·书记手记|激活老房更新“源动力”,打造人民城市“...
- 北京中考首日 各考点做足准备积极应对高温-环球快资讯
- 世界热点!通达信主图指标安全第一(附源码)