张江打造全国首个“算模电”协同项目,浦发、智谱、仪电三方合作部署万卡智算集群。 文|张洋洋 上海正在加速构建人工智能创新生态,作为上海建设全球科创中心的核心承载区,张江科学城持续推动AI、机器人技术与产业融合,持续推动“技术—产品—应用—产业”全链条发展。 昨日,在智谱开放平台产业生态大会上,浦东创投集团和张江集团联合战略投资智谱,总额10亿元。同时...
Dify 架构由多个独立模块协作构成:Nginx 负责入口路由,web 提供前端 UI,api + worker 通讯并处理业务逻辑,plugin_daemon 与 sandbox 实现插件扩展以及计算隔离,最终配合 Postgres、Redis 与 Weaviate 等存储组件支持 LLMOps。 1.请求入口:Nginx反向代理智能调度 Dify 使用...
在AI驱动的数据时代,高效爬取和处理网页数据是构建RAG(检索增强生成)和LLM(大语言模型)应用的关键。 WaterCrawl 是一款基于 Python 和 Scrapy 的开源网页爬虫工具,专为大规模数据提取和LLM优化设计,支持多语言内容抓取、实时进度监控和深度AI平台集成。 它的核心亮点是一个高性能的数据提取工具,基于Scrapy(爬取)、Djan...
Osmosis-Structure-0.6B 是一个专门设计用于结构化输出生成的小型语言模型(SLM)。尽管其参数量仅为 0.6B,但该模型在与支持的框架配合使用时,在提取结构化信息方面表现出色。 我们的方法在训练过程中利用了结构化输出,迫使模型仅关注推理引擎声明的每个键的值,这显著提高了模型在各种领域内生成格式良好、结构化的响应的能力,特别是在数学推理和问...
LLaMA-Factory Day0 支持了 GLM-4.1V-Thinking 模型的微调和推理,使用 git pull 更新代码即可尝试最新模型。 全网最全面、最详细的 LLaMA-Factory 微调视频教程免费发布了,视频地址:https://www.bilibili.com/video/BV1djgRzxEts/ 参考文献: [1] https...
基于 GLM-4-9B-0414 基座模型,我们推出新版VLM开源模型 GLM-4.1V-9B-Thinking ,引入思考范式,通过课程采样强化学习 RLCS(Reinforcement Learning with Curriculum Sampling)全面提升模型能力, 达到 10B 参数级别的视觉语言模型的最强性能,在18个榜单任务中持平甚至超过8倍...
专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 今天凌晨,著名大模型训练平台Together.ai联合Agentica开源了创新AI Agent框架DeepSWE。 DeepSWE是基于阿里最新开源的Qwen3-32B模型之上,完全...
你听说过“计时工具”吗? 这个听起来像是打工人“打卡”的软件,其实只活跃在一个极为小众的圈子里——那些靠“按小时计费”赚钱的人:律师、会计、咨询师。 但就是这样一个不起眼的工具,却在最近拿到了1亿美元融资,超过一众明星AI产品。 之所以投资人这么看好,原因也很简单,因为它掀起了一场专业服务领域的效率革命。 想象一下:当制造业已经实现成本自动核算,零售可以实...
闻乐 不圆 发自 凹非寺 量子位 | 公众号 QbitAI 在我看来,没有空间智能,通用人工智能就不完整。 这是“AI教母”李飞飞在最新访谈中对AGI的判断——是的,李飞飞也开始谈论AGI了。 不过她有自己的表述,从进入人工智能领域开始,她就确定了她终身奋斗的梦想:让智能体能够讲述世界的故事。 而这,离不开空间智能。 正如她本人所说: 我整个职业生涯...
文| 林文琪 7月2日,有网友发帖质疑微信AI搜索功能。该网友发现,如果自己的名字曾出现在微信公众号文章中,使用微信AI搜索功能中的“快速模式”时,回答的内容能一键生成关于名字的生平简历。另外,该网友还发现,如果在公众号推文中出现了人名,人名将变成超链接,他人可以直接点击人名查看所有相关信息,该网友认为这种功能对姓名小众的人士造成了困扰,并表示自己不想被“...