#AI #TIKTOK TikTok近日在美国推出了一项全新AI功能“AI Alive”,用户可以将照片通过生成式AI制作成短视频故事。这是TikTok首次推出面向所有用户的通用AI工具,标志着其迈入AI时代。

AI Alive可以为照片添加动态效果,但用户反馈参差不齐。有时生成视频需等待数分钟,结果还可能不尽如人意,甚至出现画面诡异、物体莫名移动等问题。此外,每天仅有五次尝试机会,限制了用户调整和优化的空间。

该功能由TikTok自研模型支持,部分技术借助开源AI。生成的视频会自动添加AI标签,并嵌入认证元数据,以提高透明度。

尽管功能本身仍显粗糙,但反映出TikTok正试图借AI增强平台体验。尤其是在长期面临隐私争议的背景下,其进军AI引发了外界对数据使用及模型训练方式的关注。TikTok隐私政策虽未单独说明AI用途,但表明用户数据可能用于平台优化和产品开发。

使用方式也很简单:在TikTok个人资料页点击蓝色加号上传照片,选择“AI Alive”,输入提示词并完成编辑即可。TikTok建议将关键描述放在提示词开头,以提高生成效果。

来源:I Tried TikTok's New AI Video Generator. It's All Kinds of Glitchy I Tried TikTok's New AI Video Generator. It's All Kinds of Glitchy
#AI #TrumpTariffs #贸易战 美国商务部已撤销原定于5月15日生效的《AI扩散规则》,该规则原计划限制美国AI处理器的出口数量,尤其是面向中国、墨西哥和俄罗斯等国家。这一政策最初由拜登政府提出,目的是巩固美国在全球AI技术竞赛中的领先地位,但引发了科技企业的广泛反对,认为会限制出口、损害企业创新和国际合作。

撤销后的政策意味着英伟达等芯片制造商将可以继续向海外销售用于AI的处理器。商务部表示,原规定不但会妨碍美国创新,还会破坏与多国的外交关系。

尽管如此,政府仍提醒企业注意防止美制芯片被用于中国AI模型,并特别警告不要使用华为Ascend芯片。

AI芯片企业对这一变动表达了“谨慎的欣慰”。加州AI芯片公司Blaize的首席软件官扎哈尔琴科指出,之前规则对“扩散”一词定义模糊,可能连带影响无害的AI应用场景,如公共安全、工业检测等。他强调,企业正通过更安全的硬件设计、加密处理流程及本地部署控制等手段,自主降低海外使用风险。

来源;Imminent Limits on AI Chip Exports Rescinded by Trump Administration Imminent Limits on AI Chip Exports Rescinded by Trump Administration
#AI #Google #Gemini 谷歌正在逐步用 AI 模式(AI Mode)取代首页的经典按钮“手气不错”(I’m Feeling Lucky)。据《The Verge》报道,这项功能原本是 Google Labs 中的实验项目,如今已悄然开始向所有用户推广,并登上了谷歌首页。

AI 模式是谷歌将其核心搜索功能与旗舰 AI 模型 Gemini 深度整合的重要一步。不同于 AI 概览(AI Overviews)只是总结搜索结果,AI 模式更像是谷歌版的 ChatGPT Search,直接让 Gemini 为用户完成搜索,并支持进一步对话提问。

“手气不错”按钮自谷歌创立以来一直在首页,象征着谷歌早期的俏皮与自由。但现在,它或许真的要退出历史舞台,取而代之的是更智能、更具交互性的 AI 搜索体验。谷歌显然在加速推进 AI 重塑搜索引擎的愿景。

来源:Google's AI Mode reportedly replacing iconic 'I'm feeling lucky' button Google's AI Mode reportedly replacing iconic 'I'm feeling lucky' button
#AI #OpenAI #ChatGPT OpenAI 宣布在 ChatGPT 中推出 GPT-4.1 和 GPT-4.1 mini 模型。GPT-4.1 擅长编程和指令理解,性能优于 GPT-4o,同时运行速度更快,特别适合软件工程师编写或调试代码。

GPT-4.1 正在向 ChatGPT 的 Plus、Pro 和 Team 订阅用户逐步开放,而 GPT-4.1 mini 则面向所有用户(包括免费用户)推出。作为更新的一部分,OpenAI 已移除 GPT-4.0 mini。

虽然 GPT-4.1 早在 4 月就通过 API 推出,但因未同时发布安全报告而受到部分研究者批评。OpenAI 表示 GPT-4.1 并非“前沿模型”,不需要像更强模型那样的安全审查。公司还上线了“安全评估中心”,将定期发布模型评估结果以增强透明度。

此外,OpenAI 还被传即将收购热门 AI 编程工具 Windsurf(估值达 30 亿美元)。与此同时,谷歌也更新了其 Gemini 聊天机器人,更好地支持 GitHub 项目,表明 AI 编程工具正在成为竞争热点。

来源:OpenAI brings its GPT-4.1 models to ChatGPT OpenAI brings its GPT-4.1 models to ChatGPT | TechCrunch
#AI #ChatGPT AI聊天机器人正变得越来越聪明、自然,甚至越来越像人类。那么,它们现在能通过图灵测试了吗?

图灵测试由英国数学家艾伦·图灵提出:如果一位人类评审与一台机器和一名真人对话后,无法区分谁是人,机器就算通过测试。不过,这并不证明机器真的拥有智能,它只是判断“像不像人”。

目前,大语言模型(LLM)如ChatGPT并不具备意识或真正的理解力。它们通过学习大量数据,基于概率生成最可能的回应,本质上是“词预测引擎”。

一些研究表明,ChatGPT-4在图灵测试中有54%被误认为是人类,GPT-4.5甚至达到73%,超越真人的67%。尽管如此,许多专家认为,图灵测试更多考验的是人类是否容易被骗,而不是AI是否真正智能。

因此,虽然ChatGPT有时能“骗过”人类,但这并不意味着它拥有真正的智能。随着AI不断进步,业界也在寻找新的方法来衡量AI的能力,图灵测试已不再是唯一标准。

来源:Can ChatGPT pass the Turing Test yet? Can ChatGPT pass the Turing Test yet?
#AI #Deepseek 中国AI实验室DeepSeek近期爆红,其聊天机器人应用登顶苹果和Google Play应用商店,引发华尔街和科技界关注。DeepSeek隶属于量化对冲基金幻方量化,由AI爱好者梁文峰联合创办。2023年,幻方成立DeepSeek专注AI研发,并很快发展为独立公司。

DeepSeek自建数据中心,尽管受美国出口限制影响,仍用Nvidia H800芯片训练模型。其团队以年轻博士为主,还招募跨领域人才。2023年推出的DeepSeek-V2模型因高效低成本脱颖而出,促使字节跳动和阿里巴巴降价。2024年发布的DeepSeek-V3更是超越了Meta的Llama和OpenAI的GPT-4o。同年1月发布的R1推理模型,以高可靠性著称,但会避答敏感话题。

DeepSeek虽尚无明确商业模式,却以低价策略搅动市场。其模型受到开发者热捧,并引发美方警惕,被多国及机构禁止使用。未来,DeepSeek在技术上持续精进,但面临的国际政策环境也愈发复杂。

来源:DeepSeek: Everything you need to know about the AI chatbot app DeepSeek: Everything you need to know about the AI chatbot app | TechCrunch
#AI #Google #Gemini #Android Google I/O年度开发者大会即将到来,将于5月20日至21日在山景城Shoreline圆形剧场举行。大会将发布众多新品,涵盖Android、Chrome、Google搜索、YouTube及AI聊天机器人Gemini等。

重点是AI。Google预计将发布升级版Gemini Ultra模型,并可能推出更高级的订阅计划,如Premium Plus和Premium Pro。此外,Astra项目(开发实时多模态AI应用)和Mariner项目(让AI“代理”在网络上执行任务)也备受关注。

在Android方面,Google首次举办专门的Android发布会,重点介绍Android 16。新系统将改进通知功能,引入全新设计语言Material 3 Expressive,并支持Auracast、锁屏小组件及更多无障碍功能。

此外,Google还将展示Chrome、Google Cloud、Google Play、Android开发工具及Gemma(开放AI模型库)等相关更新。去年曾发布教育AI模型LearnLM,今年可能带来NotebookLM的视频摘要功能,结合Veo 2视频生成模型,令人期待。

来源:Google I/O 2025: What to expect, including updates to Gemini and Android 16 Google I/O 2025: What to expect, including updates to Gemini and Android 16 | TechCrunch
#AI #搜索引擎 如果AI的发展速度跟 TikTok 一样“爆炸式”增长,那么未来五年的搜索市场格局就会大不同。
认为 AI 搜索的增速加倍(相当于 TikTok 的曲线轨迹)。TikTok 自身也继续稳定增长,但 AI 的爆发让它略显压力山大,AI 会迎来“跳跃式突破”。
传统搜索(Google、Bing、百度)会被更强力挤压。
这个趋势已经不是简单的“流量转移”,而是整个搜索逻辑的重塑。未来搜索不仅是“查找信息”,而是“获取即时答案 + 场景式体验”。你觉得哪些行业会最先感受到这种巨变呢?
#AI #ChatGPT #Llama 在医疗资源紧张、成本攀升的背景下,越来越多的人转向AI聊天机器人如ChatGPT进行自我诊断。一项调查显示,约六分之一的美国成年人每月至少使用一次此类工具获取健康建议。然而,牛津大学最新研究警告,这类做法存在风险,部分原因是人们往往不清楚该提供哪些信息以获取准确建议。

研究招募了约1300名英国志愿者,模拟医疗场景让他们用聊天机器人(如GPT-4o、Cohere’s Command R+ 和 Meta’s Llama 3)以及传统方法判断病情并决定就医方案。结果发现,聊天机器人不仅未提升诊断准确率,还让参与者更容易低估病情严重性。研究者指出,用户往往遗漏关键信息,或收到难以解读的回复,且AI建议常混杂优劣。

尽管苹果、亚马逊和微软等公司正积极开发医疗AI,专业机构普遍审慎。美国医学会建议医生不要依赖聊天机器人进行临床决策。研究者呼吁,应像新药一样对AI工具进行真实环境测试,以确保安全可靠。
来源:People struggle to get useful health advice from chatbots, study finds People struggle to get useful health advice from chatbots, study finds | TechCrunch
#AI #AIagents #AI智能体 微软即将更新 Windows 11 的开始菜单和多项 AI 功能,首先登陆运行 Snapdragon X Copilot Plus 芯片的新设备。新版开始菜单更宽敞,支持按类别浏览“所有应用”,并新增“手机伴侣”面板,可快速查看已同步手机的联系人、消息、通话、电量等。

Windows 11 还将引入多个 AI 功能:包括集成在设置菜单中的 AI 智能体,可协助调整系统设置、排查问题;改进的 Windows 搜索;文件资源管理器中右键新增“点击即做”快捷操作;以及 Paint、Photos 和截图工具的 AI 编辑功能。Photos 新增“重光”功能,可为照片添加多达三处光源;Paint 增加内容感知选择和生成式填充;截图工具则支持智能裁剪、图像文字提取及取色器功能。

微软称这些 AI 功能旨在让体验更直观、实用,但仍会标注“AI 生成的建议可能不准确”。更新将率先推送给 Windows on Arm 用户,Intel 和 AMD 版本稍后推出。作者表示:“AI 功能可有可无,但请先给我那个更大的开始菜单。”
来源:Windows 11 is getting a new Start menu this monthCopilot Plus PC users will get an AI agent built right into Windows settings. Windows 11 is getting a new Start menu this month
#AI #AIagents AI 智能体在职场中日益重要。波士顿咨询集团预测未来五年该市场年均增长 45%。总部位于旧金山和悉尼的 Relevance AI 开发了“AI 智能体操作系统”帮助企业构建智能体团队,近日完成 2400 万美元 B 轮融资,总融资达 3700 万美元。客户包括 Activision、Qualified 等。
Relevance 目前已有 40,000 个 AI 智能体注册,竞争对手包括微软、Retell、Qeen.ai 等。CEO Daniel Vassilev 表示,公司平台支持无代码构建,智能体可针对特定业务流程专业化训练,并兼容不同技术栈,而非受限于单一供应商生态。
公司计划用新融资提升产品能力,并加强澳大利亚和美国市场的客户支持。员工规模从 2023 年的 19 人增至 80 人。Vassilev 已搬至旧金山开设新办公室。公司还推出了“Workforce”(无代码多智能体系统)和“Invent”(通过文本提示创建智能体)两项新功能。
来源:Relevance AI raises $24M to help businesses build AI agents Relevance AI raises $24M to help businesses build AI agents | TechCrunch
#AI #文生图 #Imagiyo 利用 Stable Diffusion AI 和 FLUX AI,只需输入文本描述,即可快速生成高质量、可商用的图像,无需繁琐操作。它支持风景、角色、甚至 NSFW 内容创作(只需将提示设为私密)。Imagiyo 的商用许可让你放心将作品用于客户项目、社交媒体或作品集,无版权风险。
订阅后,每月可获得 500 张图片生成额度,每次最多提交两个提示,未用完额度可累积。此外,Imagiyo 自动提供引擎更新和新功能,确保用户始终使用最新 AI 技术。
限时优惠:6 月 1 日晚上 11:59(PT)前,仅需 $39.97(原价 $495)即可获得 Imagiyo 终身订阅。
来源:One AI image generator lets you create NSFW art, and it’s only $40 for life One AI image generator lets you create NSFW art, and it’s only $40 for life
#AI #Gemini #Google Google Gemini 2.5 Pro 通关 Pokémon Blue
Google CEO Sundar Pichai 在 X 上庆祝:“Gemini 2.5 Pro 刚刚完成 Pokémon Blue 通关!”这场直播并非 Google 官方项目,而是由软件工程师 Joel Z 独立开发的“Gemini Plays Pokémon”实验,但 Google 高管全程关注支持。Gemini 通过结合截图分析、增强信息和“agent harness”机制进行操作,由 AI 决定行动指令,再执行按键。此前 Anthropic 的 Claude AI 也挑战 Pokémon Red,但尚未通关。Joel Z 表示,Gemini 在开发中确实有“辅助干预”,但并非作弊,只是优化 AI 的推理过程。他强调,这不应被视为 AI 玩游戏能力的直接比较,因为不同模型工具链和信息输入差异较大。该项目仍在持续完善中。
来源:Google’s Gemini has beaten Pokémon Blue (with a little help) Google’s Gemini has beaten Pokémon Blue (with a little help) | TechCrunch
#AI #Duolingo 多邻国 CEO Luis von Ahn 在内部备忘录中宣布公司将转型为“AI优先”企业,逐步用 AI 替代部分人工和外包工作,推动内容生产、业务流程和产品开发的自动化。未来招聘和员工绩效也会部分基于对 AI 工具的使用情况评估。Von Ahn 强调,AI 有助于加速内容规模化生成,减少人工瓶颈,专注创造性和复杂性工作。目前 Duolingo 已开发 AI 视频辅导等新功能,计划在更多业务领域嵌入 AI。此举反映出科技业更广泛的 AI 驱动趋势,公司希望像当年押注“移动优先”一样,通过 AI 实现长远增长。他指出,这一转型需要时间,但“快速行动”比等待技术完全成熟更重要。
来源:Duolingo shifts to AI-first model, cutting contractor roles Duolingo shifts to AI-first model, cutting contractor roles
#AI #MetaAI Meta 推出独立的 Meta AI 应用,集成社交动态、语音对话和个性化体验,未来还会加入会员和广告功能。Meta 首席产品官 Chris Cox 表示,该应用为不同用户提供“轻量”和“重量”两种模式,并保留在 Instagram、Facebook、WhatsApp 的集成功能。Meta AI 的优势在于低延迟语音、个性化(结合用户社交数据)、社交互动,以及与硬件(如 Ray-Ban 智能眼镜)的深度整合。Cox 认为,社交功能能激发用户灵感,形成 AI 创作社区。Meta 还希望通过应用展示实际使用场景,推动硬件产品销售。未来,Meta AI 计划进一步拓展 Discover 动态,增强社交属性。
来源:The Verge Sam Altman and Elon Musk are racing to build an ‘everything app’
#AI #OpenAI #Worldcoin Sam Altman 和 Elon Musk 正在争夺“超级应用”的未来,两人都想打造集金融、社交、游戏于一体的万能平台。Altman 通过 Tools for Humanity 推出 Worldcoin 和 World 应用,用户通过扫描眼睛获取 World ID,不仅可用于加密交易,还可验证人类身份、对抗 AI 时代的虚假账号。World 应用集加密钱包、社交网络、小程序平台于一体,月活用户已达 2600 万。Altman 希望在人类与 AGI 并存的未来,通过这种身份验证方式,让人类在 AI 驱动的互联网中保持独特与核心。他与 Visa 合作推出 Worldcoin 借记卡,同时计划向开发者收费,未来也可能与 OpenAI 合作扩展生态。
来源:The Verge Sam Altman and Elon Musk are racing to build an ‘everything app’
#AI #Gemini #Google 下周,据《纽约时报》报道,谷歌将允许13岁以下、由父母管理Google账户的儿童使用Gemini聊天机器人。Gemini将通过谷歌的Family Link服务向这些儿童开放,家长可通过该服务管理孩子使用的Google功能。谷歌发言人表示,Gemini为年轻用户设置了专门的保护措施,且不会用这些数据训练AI。

报道称,随着人工智能竞赛加剧,各大公司正努力吸引更年轻的用户群体。然而,目前的聊天机器人仍存在不完美甚至潜在有害的问题。联合国教科文组织去年底呼吁各国政府对教育领域的生成式AI进行监管,包括设定用户年龄限制、加强数据保护和隐私保障。
来源:techcrunch Google will soon start letting kids under 13 use its Gemini chatbot | TechCrunch
#大模型 #AI 亚马逊周三发布了该公司最新、也是其 Nova 系列中最强大的 AI 模型——Nova Premier。Nova Premier 能够处理文本、图片和视频(但不包括音频),并已在亚马逊自家的 AI 平台“Amazon Bedrock”上上线。亚马逊表示,Premier 擅长处理“需要对上下文有深入理解、多步骤规划,以及跨多种工具和数据来源精准执行”的复杂任务。
来源:Yahoo Amazon 發表最新的「Nova Premier」AI 模型,主打知識檢索和視覺理解
#AI #DeepSeek #大模型 #ChatGPT DeepSeek-Prover-V2 和 ChatGPT(比如 GPT-4 或 GPT-4-turbo)虽然都是大语言模型,但它们的定位、优化目标和技术细节有很大的不同。

DeepSeek-Prover-V2:采用 Mixture-of-Experts (MoE) 架构(有 6710 亿参数,但推理时只激活一部分专家),专门为“数学推理”调优,集成了 递归证明搜索 + 强化学习优化

ChatGPT(GPT-4):采用 dense transformer 架构(所有参数参与推理),是通用语言模型,虽然具备一定的数学能力,但没有专门针对 Lean、Coq 等证明语言优化。

Prover-V2 在“数学证明”上的专精程度远超 ChatGPT,但在“闲聊”“开放式文本生成”上不如 ChatGPT。
可用性和易用性


DeepSeek-Prover-V2 需要 Lean 4 环境、API 或命令行,对于普通人使用上还是需要一定技术门槛。

总结一句话:

ChatGPT 是“语言领域的通才”,DeepSeek-Prover-V2 是“Lean 4 上的专业数学证明助手”。
如果你想要“形式化数学证明”,DeepSeek-Prover-V2 完胜;但如果需要“多领域通用对话、创作和解释”,ChatGPT 更合适。
#AI #大模型 #DeepSeek DeepSeek-Prover-V2 是中国 AI 初创公司 DeepSeek 于 2025 年 4 月 30 日发布的最新开源大型语言模型,专为在 Lean 4 环境中进行形式化数学定理证明而设计。该模型基于 DeepSeek-V3 构建,采用了 6710 亿参数的混合专家(Mixture-of-Experts, MoE)架构,旨在提升数学推理和定理验证的能力。

🔍 主要特点与创新
递归定理证明训练流程:DeepSeek-Prover-V2 引入了一种创新的“冷启动”训练方法,利用 DeepSeek-V3 将复杂的数学问题分解为一系列子目标,并在 Lean 4 中形式化这些步骤,从而生成高质量的初始化数据 。
强化学习优化:通过强化学习(RL)方法,模型在初始阶段的基础上进一步优化,整合了非正式和正式的数学推理能力,提升了定理证明的效率和准确性 。
多模型协同训练:在训练过程中,研究人员还使用了一个较小的 70 亿参数模型来处理子目标的证明搜索任务,从而提高了训练的效率和多样性 。

📊 性能表现
MiniF2F 测试集:在 MiniF2F 测试集上,DeepSeek-Prover-V2 达到了 88.9% 的通过率,显示出其在形式化定理证明任务中的强大能力 。
PutnamBench 测试集:在 PutnamBench 的 658 个问题中,模型成功解决了 49 个,进一步验证了其在复杂数学问题上的处理能力 。
AIME 竞赛问题:在最近的 AIME(美国数学邀请赛)竞赛的 15 个问题中,DeepSeek-Prover-V2 成功解决了 6 个,而 DeepSeek-V3 使用多数投票方法解决了 8 个,表明两者在数学推理能力上差距正在缩小 。

🧠 技术架构亮点
混合专家架构(MoE):模型采用了混合专家架构,在每次推理中仅激活部分专家网络,从而在保持高性能的同时降低了计算成本 。
Lean 4 集成:DeepSeek-Prover-V2 与 Lean 4 紧密集成,能够生成符合 Lean 4 语法和逻辑的形式化证明,方便数学家和计算机科学家进行验证和应用 。
 
 
Back to Top