安爸-超级家庭
bg

AI信息差

3行代码做出自己的数字人,GitHub爆火的国产项目你用上了吗?

当全球开发者还在为海外AI公司的高价订阅费发愁时,中国团队 (硅基智能)用开源代码给出了答案,只需一秒视频,短短30秒即可克隆你的数字分身;无需编程基础,三行代码即可构建实时对话数字人。 硅基智能推出的两大开源项目—HeyGem与DUIX在全球最大开源社区GitHub上引发热潮,截止目前累计斩获14.6K+星标,其中 HeyGem 更是登上GitHub Tr...

阅读:10 评论:0

TEN VAD(语音活动检测)

TEN VAD 是一个基于深度学习的轻量级流式语音活动检测模型,具备低延迟、低功耗、高准确率等优势。它通常用于语音输入大语言模型(LLM)前的预处理步骤,准确识别是否音频中包含人声并过滤掉无效音频(例如背景噪音或静音段)。 参考文献: [1] https://huggingface.co/TEN-framework/ten-vad [2] https:/...

阅读:12 评论:0

Cursor 官方教程,使用 Mermaid 生成架构图,以可视化系统结构和数据流

Cursor 官方教程,使用 Mermaid 生成架构图,以可视化系统结构和数据流。 参考文献: [1] http://docs.cursor.com/guides/tutorials/architectural-diagrams 知识星球服务内容:Dify源码剖析及答疑,Dify对话系统源码,NLP电子书籍报告下载,公众号所有付费资料。加微信bu...

阅读:10 评论:0

Tasks.md:一键搭建自己专属的任务管理系统

在使用 Notion、Trello 这类任务管理工具时,如果你怕数据隐私泄露或者迁移麻烦。不妨看下 Tasks.md 这个开源项目,可一键搭建自己专属的任务管理系统。 基于 Markdown 文件管理任务,提供精美的拖拽响应式界面,并且有丰富自定义选项,既保证数据安全又有出色的使用体验。主要功能: 基于 Markdown 文件的任务存储,数据格式开放易迁移...

阅读:10 评论:0

阿里最新财报:AI收入大涨,成新财务增长引擎

阿里巴巴发布了截至2025年3月31日的,2025财年全年及第一季度财务业绩报告。 数据显示,2025年第一季度,阿里巴巴总收入达2364.54亿元,同比增长7%。经营利润为284.65亿元,同比增长93%。归属于普通股股东的净利润为123.82亿元,同比增长279%。 其中,AI相关产品收入表现非常出色,连续七个季度实现三位数同比增长,成为阿里新的财务增长...

阅读:11 评论:0

最新W4A4KV4全量化框架,单卡A100大模型推理速度飙升

计算所王颖研究员团队联合华北电力大学和上海科技大学团队,在计算机体系结构顶级会议ASPLOS 2025(ACM International Conference on Architectural Support for Programming Languages and Operating Systems)上发表并开源了COMET框架。该框架通过系统-算法协...

阅读:12 评论:0

AI编码力压群雄!Anthropic上线最强模型Claude 4系列,“举报”模式引争议

文丨谭梓馨 在你追我赶的激烈竞争下,顶尖大模型水准再次刷出新高度。 今天,美国AI独角兽、OpenAI的强敌Anthropic召开首届开发者大会“Code with Claude”,首席执行官Dario Amodei登台发布了该公司新一代Claude模型:Claude Opus 4和Claude Sonnet 4,为编码、高级推理和AI代理设定新的标准。...

阅读:11 评论:0

字节开源视觉-语言多模态大模型,AI理解现实世界的能力越来越强了。

字节开源的Seed1.5-VL还是挺强的。 定位是视觉-语言多模态大模型,不只是能理解视觉、视频内容,还能处理一些复杂的相关问题。 视觉理解的模型,落地场景真的非常非常多。 随便举两个例子,为盲人判断红绿灯,智能导盲,长视频分析理解等等。 可能以后OCR也没有必要了,视觉模型一起做了。 看了DEMO,就知道强不强了。 以后的大模型标准,一定会加上视觉能力这...

阅读:11 评论:0

每周3000万人在看的动画竟由AI制作?解密背后团队和制作过程

在好莱坞演员罢工的时候,这家初创公司已经开始用AI做动画了。 编译 | 王涵 编辑 | 漠影 智东西5月23日消息,2年前我们还在对着人工智能(AI)生成的“威尔·史密斯吃面条”视频捧腹大笑时,一定想不到AI已经开始在动画领域大展拳脚了。 动画制作初创公司Toonstar的实践为我们讲述了一段引人深思的故事:如果AI被用来制作动画片,那会是一个怎...

阅读:12 评论:0

19岁少年「破解」谷歌新AI?每秒1479 token,扩散再战GPT!

新智元报道 编辑:KingHZ 英智 【新智元导读】年仅19岁少年,自称破解了谷歌最快的语言模型Gemini Diffusion,引爆社交平台。真相扑朔迷离,但有一点毫无疑问:谷歌I/O大会的「黑马」,比GPT快10倍的速度、媲美人类程序员的代码能力,正在掀起一场NLP范式大洗牌。 没想到扩散模型以一种另类的方式,火起来了! 来自德国的19岁的少年...

阅读:11 评论:0