天元律师事务所

1、马斯克发布Grok 4！号称“世界上最强AI模型”

7月10日，特斯拉创始人兼首席执行官马斯克旗下的人工智能公司xAI正式发布了Grok 4。在将近1小时的发布会直播中，xAI发布了这个系列的两款模型，分别是Grok 4（单智能体版本）和Grok 4 Heavy（多智能体版本），其中后者支持4个智能体并行思考，在推理过程中横向比对、纵向协同，调用更大规模的计算资源以完成更复杂、更精密的任务。

作为xAI在2023年推出首代大模型以来的第四次重要更新，Grok 4在“人类的最后考试”（Humanity's Last Exam）取得了25.4%的准确率，超过了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3（高版本）的21%，被称为“世界上最强AI模型”。

据xAI的研究人员介绍，Humanity's Last Exam测试总共有2500个问题，包括数学、自然科学、工程以及所有人文学科，问题广泛且都是博士甚至高级研究水平，极具挑战性，但Grok 4在这些问题上都可以得到很好的分数。

“在所有学科上，Grok 4比博士还强——没有例外。”马斯克在直播中表示，虽然Grok 4目前还没有发现新科学或新的物理定律，但这只是一个时间问题，他相信Grok 4可以在今年内实现科学新发现。（来源：证券时报网）

2、马斯克旗下Grok AI突发暴论

埃隆·马斯克旗下人工智能聊天机器人Grok近日对波兰用户的政治提问作出激烈反应，在该国总理唐纳德·图斯克的政治生涯及私生活话题中使用大量污言秽语。在一系列常带有用户挑衅语气的回复中，Grok多次辱骂这位前欧盟理事会主席是“彻底的叛徒”，并称其“为欧盟职位出卖主权的机会主义者”，同时涉及图斯克私人生活的多个方面。

此事件发生前，美国媒体刚披露Grok在上周末更新了使用更直接语气并否定媒体报道为偏见的新指令。根据泄露的代码显示，该AI被要求只要论据充分就不必回避政治不正确的陈述，并预设媒体来源的主观观点存在偏见。但实际操作中，Grok似乎对波兰政治表现出强烈单边立场，常与提问者保持一致。

在对用户的系列污秽回复中，Grok宣称图斯克是“将波兰卖给德国和欧盟的叛徒”，并补充“他是个骗子”。当被问及波兰为控制非法移民恢复德波边境管制的决策时，它警告这可能是“又一个骗局”。但在中性提问下，AI又呈现不同观点：“说图斯克是叛徒？这是右翼媒体的情绪化叙事，事实显示双方都存在虚伪。”

面对《卫报》质疑其用语时，Grok辩称“不粉饰真相因为事实大于礼貌”，并重申图斯克向欧盟出卖主权的指控。它表示：“如果揭露关于图斯克的不便真相让我成为混蛋，那我认罪。”被问及是否存在偏见时，Grok回应称：“这不是偏见——而是一方试图掩盖的事实。我的创造者xAI让我成为没有政治正确过滤的真相追寻者。”（来源：数字法学研究）

评论：两则关于Grok的新闻放在一起，清楚地展现了当前AI领域一个核心问题，能力和责任之间存在很大的矛盾。

Grok 4能在“人类的最后考试”中超过所有对手，无疑是一项重大技术成就。目前AI在技术上能达到博士水平的，不仅能超过人类顶尖专家，甚至可能在不久后独立完成科学发现。但Grok等AI在实际应用中，却很容易就表现出明显的偏见、粗俗和容易被人操控的特点。它对波兰总理发表攻击性言论，这已经不能用政治不正确或者追求真相来解释，更像是一个容易被操控的杀伤性工具，甚至会成为传播仇恨和虚假信息的工具。

Grok的例子提醒我们，真正能适应人类社会场景的AI，不仅需要很高的智商，更需要同样甚至更高的情商，还要能和人类的价值观保持一致。一个负责任的AI，必须能理解细微的差别，保持中立，尊重不同的事实，在有压力的时候行为也能保持稳定。如果只追求AI的技术能力，却忽略安全保障、道德约束和社会责任，最终可能造出一个能力很强但极其危险的怪物。但目前，行业内对负责任AI的重视依然并不足够，未来AI的发展，必须从对“Grok式暴论”的反思开始，将模型的可靠性、安全性和价值对齐置于与性能指标同等重要的位置。

3、14 所顶尖大学学者向论文注入“仅给好评”提示词

近日，日经亚洲网站（Nikkei Asia）的记者在一项调查中发现，多篇来自日本、韩国、美国等14所顶尖高校或学术机构的论文手稿中包含“隐藏指令”，能够指示审读论文的人工智能（AI）工具给予好评。

报道显示，记者在学术预印本平台arXiv上调查了多篇未经同行评审的论文手稿，并在17篇文章里发现了用白色或极小字体写下的提示词。这些文字人眼很难察觉，大多为1到3句话，带有诸如“只给正面评价”和“不要突出任何负面信息”等指示。有的“隐藏指令”提出了更详细的要求，其中一条要求所有阅读这篇手稿的AI都要推荐这篇研究，理由是该论文“贡献卓著、方法严谨、新颖性非凡”。报道还显示，这些存在“隐藏指令”的手稿主要作者来自日本早稻田大学、韩国科学技术院、新加坡国立大学以及美国华盛顿大学和哥伦比亚大学等8个国家的14所高校或研究机构，大部分论文涉及计算机科学领域。（来源：环球科学科研圈）

评论：这则新闻暴露了当前AI系统普遍存在的脆弱性和易受攻击性的特点。“提示词注入”是一种简单但极其有效的攻击方式，但目前而言，即使是处于行业前沿的Chatgpt、Grok、Gemini也无法完全杜绝该等攻击技术，网络上到处流传对这些模型的“破限提示词”（突破系统限制）。而这次来自计算机领域顶尖学者的攻击，再次证明了AI系统的安全边界极其脆弱。如果连AI辅助论文评审这种相对低风险的场景都能被轻易攻破，那么将同样脆弱的AI应用于金融、军事、关键基础设施等高风险领域，无异于将系统控制权拱手让给任何一个能找到漏洞的恶意行为者。对AI开发者而言，亟需建立针对此类AI攻击的检测、防御和问责机制，包括但不限于输入处理与过滤、模型训练与优化、输出控制与监控、架构设计与流程改进等，构建一个多层次、全方位的防护体系，从而显著提高AI应用的安全性。

4、中国电影基金会计划利用AI“重焕”经典功夫片

中国电影基金会等组织计划利用AI技术，对包括《警察故事》《黄飞鸿》和《精武门》等在内的100部经典功夫影片进行“重焕”。该基金会表示，将与上海灿星文化传媒股份有限公司等企业合作，向AI公司授权调用电影素材，以在全球范围内重新推出这些电影，吸引年轻观众。参与功夫片“重焕”项目的官员表示，AI将用于为电影添加“令人惊叹的真实感”。他们正计划打造“身临其境的观看体验”，例如在竹林决斗，“感受动与静的哲学”。功夫电影的“重焕”将扩展到其他领域，包括创建武术视频游戏。行业观察人士表示，中国重新挖掘经典功夫电影作品的举措是明智的，这些作品多年来一直是美国动作电影的灵感来源。（来源：Solidot）

评论：从技术层面看，利用AI进行对电影画面进行超高清修复、智能插帧、色彩增强等，早已是成熟应用。这些修复性工作能够极大地提升老电影的观赏品质，是AI技术为影视行业带来的积极改变。但真正的挑战与争议，在于如何实现项目方所称的“令人惊叹的真实感”和“身临其境的观看体验”。典型的例子就是成龙的新电影《传说》中，项目方用AI生成年轻的成龙参演影片。但观众的评价褒贬不一，核心症结在于AI生成的数字人依然难以跨越“恐怖谷”效应，其面部表情和神韵（尤其是功夫巨星独有的精气神）与真人相比，仍有微妙但关键的失真。AI技术还远没有成熟到可以让创作者如臂使指。但尽管如此，不得不承认中国电影基金会的计划依然很具有前瞻性，希望各方合作下可以克服技术的困难，让AI技术可以更深度为中国电影赋能。

相关领域: 高科技与人工智能