安爸-超级家庭
bg

AI进家庭

上交所同日受理摩尔线程和沐曦IPO申请,均未盈利

文| 杨柳 6月30日,国产GPU芯片公司摩尔线程和沐曦的科创板IPO申请,正式获上海证券交易所受理,分别拟募资80亿元和39.04亿元。 这意味着摩尔线程和沐曦在推进IPO进程中已领先一步。目前有四家头部AI芯片厂商冲击IPO,其余两家燧原科技、壁仞科技仍未结束上市辅导。 关键财务指标来看,摩尔线程和沐曦两家公司虽然营收增速快,但目前均未实现盈利。经营前...

阅读:9 评论:0

猫猫拯救科研!AI怕陷“道德危机”,网友用“猫猫人质”整治AI乱编文献

克雷西 发自 凹非寺 量子位 | 公众号 QbitAI 猫猫再立新功,这次竟然是拯救了人类的科研进程? 事情是酱婶儿的: 小红书上有人发帖说,自己通过以“猫猫”的安全相威胁,成功治好了AI胡编乱造参考文献的毛病。 据博主所述,掌握了猫猫命运的AI(Gemini),真的找到了真实的文献,还不忘解释说猫猫绝对安全。 这篇戳中无数科研人痛点的帖子,获得了400...

阅读:8 评论:0

1080p飞升4k,浙大开源原生超高清视频生成方案,突破AI视频生成清晰度上限

浙大APRIL实验室团队 投稿 量子位 | 公众号 QbitAI 为什么AI生成的视频总是模糊卡顿?为什么细节纹理经不起放大?为什么动作描述总与画面错位? 其中一个重要原因在于,现有的开源千万级视频数据集分辨率基本低于1080P(1920×1080),且大部分视频的说明(caption)简单粗糙,不利于大模型学习。 当主流视频生成模型还在720P画质挣扎...

阅读:9 评论:0

开源人工智能:数字主权的基石

随着人工智能正在重塑从教育到国防的方方面面,数字主权已不再是一个长期的愿景,而是一个迫在眉睫的现实需求。 为了确保各国能够对影响其社会的人工智能系统进行治理、审核和建设,开源人工智能正成为实现自主可控、激发本土创新、重建公众信任的关键支柱。 什么是数字主权? 数字主权是指一个国家或地区具备能力,依据自身的法律、价值观和战略利益,独立地治理、控制和保护其数字基...

阅读:7 评论:0

Nanonets-OCR-s:从学术论文到法律合同,智能识别公式、签名、表格与图像

在数字化时代,文档处理和信息提取的需求日益增长。传统的OCR技术虽然能够识别文档中的文本,但在处理复杂文档时往往存在局限性。Nanonets-OCR-s 作为一款先进的图像到 Markdown 的 OCR 模型,不仅能够提取文本,还能将文档转换为结构化的 Markdown 格式,并具备多种智能功能 一、Nanonets-OCR-s 概述 Nanonets...

阅读:6 评论:0

DeepSeek-R2 推迟发布?一场关于性能、芯片与时机的博弈

最近关于 DeepSeek-R2 的讨论很热。 我翻了一下,最初的信息源应该是科技媒体 The Information 于 6 月 26 日发表的一篇题为《DeepSeek’s Progress Stalled by U.S. Export Controls》的文章,其中指出 DeepSeek 内部的 R2 模型开发遇到了两个关键瓶颈:一是 CEO 梁文锋对...

阅读:7 评论:0

大模型应用不同提示词范式和ReAct Agent智能体实现原理分析

“ 大模型应用提示词是核心,但智能体中大模型是核心,大模型会接收用户输入和工具调用结果,同样也会返回思考过程和调用参数。” ReAct Agent基于思考-行动-观察的智能体,简单来说就是让智能体有更强的规划和逻辑推理能力,并且能够依靠自身去解决问题。 在前面的几篇文章中介绍了关于智能体的内容,以及大模型与提示词之间的关系;而今天我们再来仔细分析一下智能...

阅读:8 评论:0

【Agent专题】Agent开发篇:Agent任务拆解全流程+实用代码,附可运行代码&实战流程

2024年是大模型从“会聊天”走向“能干活”的关键一年。从AutoGPT、BabyAGI掀起热潮,到微软AutoGen落地企业场景,再到清华智源的AgentVerse大模型评测体系,一个共识逐渐浮出水面:Agent的核心能力,不在“回答”,而在“拆解”。 无论是数据分析、代码生成,还是复杂流程自动化,想让大模型从“对话者”变成“行动者”,第一步就是——把复...

阅读:8 评论:0

聚焦RAG&KG&LLM&文档解析:老刘说NLP技术社区对外纳新

老刘说NLP技术社区,自建立以来,旨在以公正、客观的角度,围绕‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍大模型&RAG&文档智能&知识图谱四个方向,展开每日早报、社区讨论、月度不定时分享、月度备份、专题整理等多种形式,以期达到一个较好的技术分享。 一起共创,共同地提升老刘说NLP的价值感和技术深度感,将是一件十分有意义的事儿,我们正在朝这个方向...

阅读:7 评论:0

Dify落地知识库场景的小思考及多模态RAG结合图像信息的几种策略评估

今天是2025年7月1日,星期二,北京,晴 今天是2025年下半年的第一天,新的起点,我们继续看技术。 从评估角度看多模态RAG中的文档信息增强,逐步整合跨模态输入(文本、图像、字幕、OCR)后对应的相应影响,虽然说,这种范式看起来像是去年的,但温故而知新。 另外,来看看一个问题,关于dify是否应该被抛弃的一些思考?还是要分具体使用场景去看。 一、从评估角...

阅读:7 评论:0