安爸-超级家庭
bg

AI进家庭

因为盲审没过,被延毕了……

临近毕业季,不管是硕士生还是博士生,毕业前最大的一关就是盲审。通过了,就基本可以宣告毕业在即;没过,则要面对可能“延毕”的深渊。 实话, 论文盲审没过,一度陷入了自我怀疑中,觉得自己干啥都不行,能力不行,即使很努力了,也还是没能通过盲审。虽然可以下半年再次送审,但是真的是一点信心都没有了。 不管是什么原因导致的大修,一定要加快改论文的节奏,因为你所有...

阅读:9 评论:0

ICLR 2025 从碎片到完整:面向语义完整且等价的多模态视觉分词新范式SeTok

当前,多模态大语言模型(MLLMs)在视觉-语言理解任务中取得了令人瞩目的进展,其中视觉分词(vision tokenization)作为视觉与语言语义对齐的关键环节,发挥着至关重要的作用。 然而,现有方法往往采用将图像划分为规则网格(grid patch token)的方式,这种过度碎片化的分词策略破坏了视觉语义的完整性,导致视觉与语言表征之间难以实现有...

阅读:8 评论:0

推测性思维链SCoT:小模型“模仿”大模型,最高提速2.9倍,准确率几乎不降

现在的大模型(比如论文提到的 Deepseek-R1)虽然能解决复杂数学题,但有两个致命缺点: 体型庞大:动辄几百亿参数,像“超级计算机”一样耗资源; 思考过程长:解一道题要生成几千甚至上万字的思维链(Chain-of-Thought, CoT),相当于“把草稿纸写满才交卷”。 这就导致用大模型做题成本高、速度慢,用户体验像“等蜗牛爬完马拉松”。 论...

阅读:8 评论:0

一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二

新智元报道 编辑:LRST 【新智元导读】随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰,获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之,仅用以往工作0.1%的数据量(获取自公开数据集)和1%的训练参数,以极低成本实现了图像的高质量编...

阅读:9 评论:0

速递|两个月估值10亿!前OpenAI与DeepMind的“技术混血”,要用AI颠覆半导体与太空超导材料

图片来源:Unsplash 据内部人士透露,由 OpenAI 前训练后研究副总裁利亚姆·费杜斯创立的初创公司 Periodic Labs,已向潜在投资者表示希望以至少 10 亿美元的估值筹集数亿美元资金。这对于仅成立两个月的初创企业来说是一个相当高的估值。 可能助长这一高额融资目标的是,费杜斯曾是 ChatGPT 的核心贡献者之一。他与曾在谷歌 Dee...

阅读:9 评论:0

00后华人打造AI作弊工具狂揽3800万融资:求职不再是人找人,AI对轰时代来了

一个 21 岁的华人大学生,因为开发一款 AI 产品被学校开除,转头就凭借这个产品拿到了 530 万美元(约合 3825 万人民币)融资。 最近你或许看到过这个传奇故事,这个大学生开发的 AI 工具,号称能够帮助用户「在一切事情上作弊」。 产品演示,AI 在约会中提供建议 这是一个叫为 Interview Coder 的面试作弊工具,可以隐藏浏览器窗口不被面...

阅读:10 评论:0

速递|​“让AI像人类一样协作”:Relevance AI融资3700万美金,打造企业“数字员工”流水线​​

图片来源:Relevance AI 随着AI Agent 在工作场所日益普及,个人可能会与之紧密协作。波士顿咨询集团报告指出,未来五年内,AI Agent 市场预计将以45%的复合年增长率扩张。 如同人类员工一样,AI Agent 可通过入职培训学习各类岗位技能,获取公司信息与业务背景,并融入工作流程。此外,不同于传统自动化工具,AI Agent 具备...

阅读:10 评论:0

98%财务顾问依赖AI,揭秘7家先锋企业如何解锁商业新格局

新智元报道 编辑:英智 【新智元导读】摩根士丹利的案例表明,企业应用AI离不开快速试错与优化。AI通过分析海量数据打造个性化体验,Indeed的职位推荐和Lowe’s搜索优化证明了数据与AI结合的巨大潜力。 AI正以前所未有的速度,重塑企业运营和竞争格局。 从金融服务到电商零售,从求职招聘到家装购物,AI带来了巨大的变革潜力。 OpenAI最新发布...

阅读:11 评论:0

速递|已获2000万美元融资,苹果前高管携Unblocked挑战代码理解“黑箱难题”

图片来源:Unblocked 每位开发者都有自己独特的编码风格。尽管公司制定了最佳实践并编写了文档,开发者要理解他人的代码库仍非易事。 为解决这一问题,Dennis Pilarinos 开发了一款名为 Unblocked 的工具——这是一款 AI 驱动的助手,能针对代码行回答上下文相关问题。 Pilarinos 是开发工具领域的资深专家,曾担任微软和亚...

阅读:10 评论:0

碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一

整理|冬梅、核子可乐 I/O 前夕,谷歌突发 Gemini 2.5 Pro 预览版 昨晚,谷歌在 I/O 大会之前宣布推出 Gemini 2.5 Pro Preview(I/O 版)。作为其旗舰产品 Gemini 2.5 Pro AI 模型的升级版本,搜索巨头宣称该模型在多项主流基准测试中均名列前茅。 Gemini 2.5 Pro Preview(I/O...

阅读:9 评论:0