智算无界:AIDC的超越和重构-上海贝尔等技术要求。借助RDMA技术,通过分布式智 算中心网络实现区域内多智算中心协同计算,可以满足更大规模的算力需求。 总而言之,算力的需求正在快速增长。由于AIGC的出现,大模型的训练和推理导致智算超越了通算。智 算中心节点规模越来越大,对网络性能(吞吐和时延)要求越来越高,其发展趋势是从scale up到scale out,直至scale outside。出于成本的考量,800Gbps及以10 积分 | 38 页 | 9.31 MB | 22 天前3
税务行业标准大模型集团多年累积的超百万法规库、千万量级的案例判例、几万本税务电 子书,以及专家知识及实操案例等。 目前,税务行业标准大模型成为了税务这一垂直行业领域大模型 的典型应用,并在注册税务师考试中的成绩已经超越了 ChatGPT。凭 借其创新技术与应用表现,入选“北京市通用人工智能大模型行业应 用十大典型场景案例”。 技术简介 一、税务行业标准大模型的技术优势 2023 年以来,360 税务标准大模型主要特点: 1、专业的模型能力 相较于通用大模型能够解决一般性问题,税务行业标准大模型可 以解决税务领域更为专业的知识问题。据测试,该模型在注册税务师 考试中的成绩已经超越了 ChatGPT。 2、强大的研发团队 360 集团与中税集团组建专业团队,汇集多位深耕人工智能技术领 域的创新技术专家,以及具有丰富实操经验的税收专家,形成 GPT 培 数字人等多项功能,在咨询对话、问题整理、问办一体和数据分析等 多个环节做场景应用。 与通用大模型不同,税务行业对大模型提出了更高的专业要求。 据测试,该模型在注册税务师考试中的成绩已经超越了 ChatGPT。大 模型在注册税务师考试中,知识题正确率 77%,计算题正确率 38%, 模型总体得分稳定为 53.7%,是其他同类竞品模型的 3 倍。 在实际应用中,税务领域有明确目标并且税务行业认可,即参加10 积分 | 5 页 | 381.51 KB | 1 月前3
电子:DeepSeek-R1加速AI进程,看好AI应用端潜力释放资料来源:iFinD,财信证券 投资要点: 事件:《科创板日报》2 月 8 日消息称,据 QuestMobile 数据显示, DeepSeek 在 1 月 28 日的日活跃用户数首次超越豆包,随后在 2 月 1 日突破 3000 万大关,成为史上最快达成这一里程碑的应用。 革命性推理能力叠加出色性价比,DeepSeek-R1 模型引发全球关注。 据 DeepSeek 官网数据,DeepSeek-R1 股票投资评级 买入 投资收益率超越沪深 300 指数 15%以上 增持 投资收益率相对沪深 300 指数变动幅度为 5%-15% 持有 投资收益率相对沪深 300 指数变动幅度为-10%-5% 卖出 投资收益率落后沪深 300 指数 10%以上 行业投资评级 领先大市 行业指数涨跌幅超越沪深 300 指数 5%以上 同步大市10 积分 | 4 页 | 269.47 KB | 7 月前3
DeepSeek洞察与大模型应用-人工智能技术发展与应用实践MLA多头潜在注意力机制(降低显存占用) • MTP多token预测(提升效果、提升推理速度) • FP8混合精度训练、DualPipe流水线、MoE负载 均衡(提升训练效率,降低训练成本) DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和 世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。 DeepSeek-V3 -4- a不会因此减少AI支 出:“我仍然认为,从长远来看,大力投入资本支出和基础设施建设将成为一种战略优势。” 卷积神经网络之父Yann LeCun: “与其说中国AI正在追赶美国,不如说开源模型正在超越 闭源”。 Anthropic CEO达里奥·阿莫迪:我认为一个公平的说法是“ DeepSeek 生产的模型接近 7-10 个月前美国模型的性能,成本要低得多(但远不及人们建议的比例) ” 配和生态方面还有显著差距 vs. -15- 中美在AI领域的对比:头部大模型 n 在模型效果上,中国大大缩小了与美国的差 距,呈现与美国平分秋色的格局 n 模型开源领域:DeepSeek超越Meta,成 为效果最好的开源模型,阿里巴巴千问系列 模型下载量超过Meta的Llama系列 模型厂商 国家 代表性模型及竞技场排名 是否开放 模型权重 谷歌(Google) 美国 Gemini-210 积分 | 37 页 | 5.87 MB | 7 月前3
DeepSeek华为云AI解决方案华为云部署方案 3. DeepSeek 应用场景 3 Huawei Proprietary - Restricted Distribution d e e p seek 全球增长最快应用,增长势头超越 ChatGPT 截止 2.5 号,上线不到一个月 DeepSeek 日活跃用户数已突破 2000 万,达到 2215 万,全球下载量接近 4000 万; DeepSeek 的访问量达到了创纪录的 发布聊天版本 2023 年 8 月 2024 年 5 月 DeepSeek R1-Lite- Preview 发布 宣称在逻辑推理、数学推理和实 时 问题 解决 等任 务上 超越 OpenAI O1 ,但《华尔街日报》测试发现 OpenAI O1 在部分问题上更快。 12.26 DeepSeek R1 发布 比肩 OpenAI o1 ,支持模型蒸馏, 年 5 月成立持续走开源道路, 24 年底发布 AI 核弹级产品震 惊全球 DeepSeek-V3 发布 671B 亿参数, 仅 55 天训练 ,十分之 一 的成本,( 558 万美元) ,超越 Llama 3.1 和 Qwen 2.5 ,与 GPT - 4 O 相当。 发 布 首 个 模 型 DeepSeek coder , 免 费供 商 业使 用 且完 全 开源10 积分 | 16 页 | 850.86 KB | 7 月前3
华为-人工智能行业:智能世界2035-20250918-134页AI、数字行为建模、远程医疗和合成生物学等前沿技 术驱动的全球健康生态系统。 这份报告客观阐述了 AI 和 ICT 技术融合将如何推动变革,造福人类和社会。 Joseph Sifakis 序言 为实现上述愿景,我们仍面临诸多超越通用人工智能范畴的技术挑战。我们的目标不仅是创造 一种“能够理解、学习任何人类所能完成的智力任务的机器”,更在于让机器能够整合自身能力, 自主行动,感知现实环境,并以自适应且可靠的方式追求其目标。 衡,并通过 定期或针对性的更新,实现系统的持续演进。 此外,系统验证目前正从理性主义向经验主义转变。传统的基于模型的技术虽能保证高可靠 性,但由于系统固有的复杂性和异构性,已不再适用。我们需要超越当前随机测试和仿真的方法, 开发更严格的验证技术。同时,我们还必须通过基于知识的监测技术弥补可靠性降低的影响。 报告中提到的愿景既广泛又宏大,与科技巨头截然不同。科技巨头通常依赖机器学习并推崇超 生成上取得了重大成就,但其认知模式仍困于基于多重线性统计关联的框架内,因此,普遍认为它 仍缺乏对复杂物理现象以及因果关系的深层次抽象与推理的能力。真正的突破或将源于一种使数据 空间和物理空间深度融合的超越现有范式的新架构,这个新架构应能够将数理原理或知识内嵌到数 据空间中,使其能完整准确认知数据系统中的复杂性,这是我们研究和经常讲到的精准智能或 SCI for AI。这是一个复杂系统自组织、自20 积分 | 134 页 | 27.89 MB | 1 月前3
基于大语言模型技术的智慧应急应用:知识管理与应急大脑BERT)的能力,来调整多层神经网络 模型的内部大量神经元连接权重参数,实现对知识 的获取。这一参数调优过程在连续平滑数值空间进 行,与符号化表示的知识获取中的离散符号操作相 比,可以捕捉更为复杂和细致的规律,实现对过往 经验的超越。 1.1.4 知识分布式隐式表示 与符号化知识表示不同,模型获取的知识内嵌 于神经网络模型的海量参数中,无需对其进行显式 表示,这种分布式隐式表示能够处理符号化知识表 示无法处理的情况,例如,无法言明的复杂知识。 可能,打破了传统知识壁垒,有利于知识的连接和 融合,促进了应急知识的创新。相比较于知识的符 号化表示,数值表示的知识能反映更复杂、更细微 的事物本质及其变化规律,能通过数值空间的向量 操作来完成特定知识任务,这使得应急知识的应用 能超越过往经验。根据新的应用场景进行适应性调 整,对于理解和处理复杂的应急管理情境至关重要, 能极大地促进应急知识的应用场景创新[26]。 3.1.2 知识共享 依赖于大模型的自然语言处理能力,用户可以 利用大语言模型技术建设应急管理知识生产网 络中的超级节点,将各领域的行业专家、各学科的 专业学者、各应急部门的专业人员等各类应急知识 生产者有机联合起来,参与每一轮问题解决中,最 大化网络中节点联结密度,超越跨学科知识生产中 知识生产场所和应用场景的物理局限,实现知识生 产的人机协作。应急知识生产超级节点作为网络中 联结密度最高的节点,扮演了一个交流中心的角色, 在与知识生产者交互中加深认识、产生联想、激发20 积分 | 8 页 | 3.21 MB | 1 月前3
电子AI+系列专题:DeepSeek重塑开源大模型生态,AI应用爆发持续推升算力需求大模型竞技场 (LMSYS) 位列全球开源模型第一名,依靠创新结构,将推理成本降低近百倍。 l 2024 年 12 月, DeepSeek-V3 发布,性能对齐海外领军闭源模型。该模型在多项评测集上超越了阿里 Qwen2.5-72B 、 Meta 的 Llama-3.1-405B 等其他开源 模型,并 逼近 GPT-4o 、 Claude-3.5-Sonnet 等顶尖闭源模型。据官方技术论文披露, 首个版本上线并同步开源。 DeepSeek-V3 为自研 MoE 模型,共有 671B 参数,每个 token 激活 37B ,在 14.8T token 上进行 预训练。 DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 及 Claude-3.5-Sonnet 不分伯仲。 l DeepSeek-V3 ,对用户开放思维链输出; DeepSeek 官网与 App 同步更新上线, 用户打 开“深度思考”模式,即可调用最新版 DeepSeek-R1 完成各类推理任务。 l DeepSeek 蒸馏小模型超越 OpenAIo1-mini 。在开源 DeepSeek-R1-Zero 和 DeepSeek-R1 两个 660B 模型的同时,通过 DeepSeek-R1 的输出,蒸馏了 6 个小模 型开源给社区,10 积分 | 38 页 | 1.95 MB | 7 月前3
AI大模型对智能汽车产业的影响(26页 PPT),存在安全隐患。 SAE 对自动驾驶的分级标准 自动驾驶近年来一直未能进入 L3 时 代 资料来源: SAE J3016- 2018 100 亿公里 马斯克曾在推特点赞了这样的观点: 实现超越人类的自动驾驶能力至少 需要 100 亿公里驾驶数据。 1000 亿公里 自动驾驶初创公司 MOMENTA 在其 公众号上提出: 要实现 L4 级驾驶,至少需要千亿公 里驾驶数据。 因此有较强的泛 化性。 AI 大模型可大幅减少长尾效应,提高自动驾驶安全 性 汽车的 图片来源:百度阿波罗, 毫末智行 100 亿公里 马斯克曾在推特点赞了这样的 观点: 实现超越人类的自动驾驶能力 至少需要 100 亿公里驾驶数据。 1000 亿公里 自动驾驶初创公司 MOMENTA 在其公众号上提出: 要实现 L4 级驾驶,至少需要千 亿公里驾驶数据。 202210 积分 | 26 页 | 2.76 MB | 7 月前3
AI大模型时代下的网络安全建设方案(37页 PPT)50 94.52 命令注入 36780 65.90 39.88 98.55 利用大模型重做 Web 安全检测: • 仅百亿级参数大模型,训练两周, 效果超越持续优化 4 年的语义分析引擎 • 12 类无样本攻击类型, 其中 9 类超越了现有语义分析引擎 • 5000w+ 实际流量样本测试,大模型优化后呈现高检出、低误报特性 【题目示例】请问以下流量是否恶意: GET /easportal/tools/appUtil20 积分 | 37 页 | 7.79 MB | 1 月前3
共 73 条
- 1
- 2
- 3
- 4
- 5
- 6
- 8
