发布动态
release-202409
2024.09.12
【模型发布】日日新-商量图文多模态大模型 v5.5
- 无需申请开通,即可体验V5.5版本 日日新-商量图文多模态大模型 SenseChat-Vision,免费体验期截止到10.31号。
- 全面实现模型基础能力优化,在对象属性识别、空间关系、动作事件识别、场景理解、情感识别、逻辑常识推理和文本理解生成上都实现了较大提升。
- 新的版本支持多图的输入,一定程度提升指令跟随能力。
- 多样化图表理解能力提升。带有具体数据的基础统计图表如条形图、折线图、饼图、表格等图表的高精度理解,并在复杂图表的理解上有所提高。
- 学科相关解题能力小幅度提升,包括意图理解,过程分析,支持标准LaTeX格式输出。
- 中英文OCR能力优化,实现繁体、手写体识别有明显提升,书法、日韩识别能力小幅提升。
- 实现对驾驶场景的有效理解,支持根据交通交规状况和驾驶场景给出合理建议,支持车舱大脑、自动驾驶等多个实际场景应用。
release-202408
2024.08.28
【服务更新】模型调用速率限制升级
- SenseNova 商汤日日新大模型 开放平台调用速率限制指标,从原先的仅接口层面上的RPS限制,扩充到模型层面上的RPM和TPM限制,这样既可以提高每个用户调用模型服务的公平性,又有助于防止 API 的滥用或误用。
- RPS(Requests Per Second):每秒请求数
- RPM(Requests Per Minute):每分钟请求数
- TPM(Tokens Per Minute) :每分钟处理Tokens数(输入和输出)
2024.08.28
【模型发布】日日新-语音大模型-语音合成 v1.0
- 高度拟人化:商汤利用自主研发的 SenseTTS 生成式神经网络语音模型,使生成的语音在语调、韵律、情感表达等方面达到高度逼真的水平,超越了传统语音合成技术。
- 灵活应用广泛:商汤的语音合成技术适用于智能客服、新闻播报、对话闲聊、有声读物、车载导航等多种应用场景,极大地拓展了语音交互的可能性,不仅提升了用户体验,还为企业的智能化转型提供了强大的支持。
release-202407
2024.07.31
【模型发布】日日新-商量大语言模型-通用 v5.5
- 基础参数规模提升:基础模型性能提升30% 。
- 基础能力重大升级:数学推理性能提升了31.5%,英文能力提升53.8%,指令跟随能力提升26.8%,长文本理解提升19%,在主流客观评测上比肩GPT4o 。
- 升级长上下文function call功能:尤其在单次输入规模超过32K tokens场景下,Function Call召回率和准确率均有显著提升;另外,在Assistant API调用场景下的web search,vqa,text2image的工具调用准确率显著提升。
release-202406
2024.06.17
【服务发布】图文对话生成
- 正式对外开放图文对话生成接口,可基于此接口调用多模态大模型能力,完成图片识别、视觉对话等多模态相关任务
- 无需申请开通,即可体验日日新-商量图文多模态大模型 SenseChat-Vision,免费体验期截止到6.30号,7.1号开始调用收费
- 之前的多模态内测接口,也将在7.1号正式关闭调用,请自行将服务切换到正式的图文对话生成接口,以免影响自身应用的模型调用
release-202405
2024.05.29
【模型发布】日日新-商量大语言模型-拟人对话-高级版
- 能力提升:在标准版的基础上,角色对话、人设、及剧情推动能力全面提升
- 更长记忆:支持32K上下文长度,使AI角色可精准记忆百轮以上历史对话内容
- 中英适配:支持中/英文对话,赋能海外拟人对话场景
2024.05.13
【模型发布】日日新-商量大语言模型-通用-轻量 5.0
- 轻量模型灵活选择:新增200亿参数、32k 上下文窗口长度的模型,适配各类应用场景。
- 基础能力重大升级:常识、推理、数学、代码等领域的能力有明显提升。
- 支持function call功能:支持用户传入各类自定义工具,自动选择并调用工具。
- 支持code interpreter功能:自动生成Python代码解决数学问题,降低直接数值计算错误,提升数学解题能力。
2024.05.06
【模型发布】日日新-商量大语言模型-粤语版本 5.0
- SenseChatV5-Cantonese是基于SenseChatV5的核心技术开发的定制版本,专门为适应香港地区的对话习惯、俚语及本地知识而设计。该模型通过整合超过50万条高质量数据,显著提升了其在粤语本土化对话理解方面的能力,在粤语的对话理解上超越了GPT-4。
- SenseChatV5-Cantonese通过精心挑选和整合的高质量语料库,在语言对话质量、语料质量和信息密度方面实现了显著提升,从而塑造了其卓越的粤语语言处理能力。此外,该版本继承了SenseChatV5原版的核心优势,融入了混合专家架构,在知识、推理、数学及代码编写等多个领域均能与GPT-4 Turbo相媲美。
- SenseChatV5-Cantonese的发布,标志着商汤科技在人工智能领域对本土化需求的深刻理解和积极响应,为用户提供了一个既精通粤语又具备广泛智能应用能力的先进对话系统。这一创新不仅提升了用户体验,也为粤语地区的用户提供了更加个性化和高效的智能交互解决方案。
release-202404
2024.04.23
【模型发布】日日新全系列模型更新
【日日新-商量大语言模型-通用】V5(128K)API + 体验中心
- 多款模型灵活选择:新增1000亿参数、不同上下文窗口长度的模型,适配各类应用场景
- 基础能力重大升级:语言、知识、推理、数学、代码等领域的能力有明显提升,在主流客观评测上达到或超越GPT-4 Turbo
- 主观体验显著提升:在开放问答场景做了重点优化,在聊天、多轮对话、信息提取、写作等场景和GPT-4 Turbo媲美
- 支持function call功能:支持用户传入各类自定义工具,自动选择并调用工具,准确度达到99%
- 支持code interpreter功能:自动生成Python代码解决数学问题,降低直接数值计算错误,提升数学解题能力。在公开数学测评数据集上逼近GPT-4 Turbo的水平
【日日新-商量大语言模型-拟人对话】V5API + 体验中心
- 支持角色创建与定制:支持设置角色基本信息、详细设定、对话风格、开场白等人设信息创建AI角色
- 支持知识库构建:支持行业领先的知识库构建,大幅提升AI角色知识能力,使其可精准回复角色设定、人物关系、世界观、剧情/事件记忆相关内容
- 支持长对话记忆:支持长对话记忆,使AI角色可精准记忆几十轮以上历史对话内容
- 支持多人群聊:支持三人及以上群聊对话,使AI角色可识别自我身份及人物关系,并符合逻辑地推动剧情
- 支持角色亲密度:支持设置不同档位的对话亲密度,使AI角色可在不同阶段给予用户不同对话体验
【日日新-商量大语言模型-代码生成】V5代码小浣熊
- 能力提升:支持32k上下文,上下文8K->32K,支持更长的对话记忆与理解
- 精度提升:主流编程语言精度提升约10%,此外SQL精度提升约15%
- 体验优化:模型指令遵循能力提升,用户意图理解能力提升,用户输入中文的情况下,误输出英文的概率下降
【日日新-商量大语言模型-数据分析】V5
- 整体精度提升,特别针对复杂表格场景,精度提升超5%
- 模型性能提升,用户体验增强
【日日新-商量大语言模型-医疗版本:“大医”】V5API + 体验中心
- 持续的医疗应用能力提升:对比openAI-GPT4, 在检验检查问答、电子病历生成、线上问诊、导诊、随访、辅助诊断决策等多项医疗任务中实现超越* 医疗细分领域调优,已支持20+场景
- 智能体应用全新升级,打造医生及患者全面智能助手* 匹配医疗场景的检索增强框架、长程记忆、复杂工具调用、医学数据分析等,支撑医疗的多样性应用
- 支持轻便高效的模型部署
【日日新-商量图文多模态大模型】V5 API + 体验中心
- 图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU 取得领先成绩
- 支持业界领先的超大分辨率输入功能,可准确识别提取海报、文档、UI中的关键内容
- 更懂你的日常助手,在多模态场景下的支持多项日常功能,如穿搭建议、食品分析、文案创作、烹饪建议等
- 支持车舱大脑、智能助理、自动驾驶等多个实际场景应用,助力千行百业的产业升级
【日日新-秒画文生图大模型】V5API
- 支持图像内文本字符的生成:此次更新增加了对英文字符的生成支持,用户可以在图像中直接生成所需的英文文本,极大地增加了图像的应用范围和灵活性
- 更强的文本理解能力:模型的文本理解能力得到显著增强,能更准确地把握用户的意图并转化为具体的图像内容,更好地满足用户对复杂场景的需求
- 画面表现提升:在画面质量方面,本次更新对图像的细节和光影效果进行了深入优化。提升了图像的整体美学表现,使生成的图像更具视觉冲击力和艺术感
release-202403
【服务更新】Function Call 函数调用Beta
- 对话生成支持函数调用(Function Call)能力,支持返回流式输出结果
2024.04.23
【服务更新】Assistants 构建Beta
- 助手构建支持用户指定自定义函数并传入调用结果
- 运行任务支持返回流式输出结果
release-202402
2024.02.02
【模型发布】日日新全系列模型更新
【日日新-商量大语言模型-通用】V4(4K/32K/128K)API + 体验中心
- 多款模型灵活选择:支持多款不同参数量、不同上下文窗口长度的模型,适配各类应用场景
- 基础能力重大升级:新增超过千亿的中英文训练语料,显著提升模型在通用对话、知识理解、阅读理解、综合推理、代码理解等领域的能力
- 超强的上下文理解:上下文窗口最大支持128K,在长文本理解及生成等任务中表现出色,为模型在实际应用中更好地理解和应对复杂场景提供了坚实基础
- 模型效果显著提升:模型能力全面升级,在知识(Knowledge)、推理(Reason)、数理(Math)、情感理解、长文本理解等领域均有显著提升
- 支持输出引用标签: 在融合外部参考知识(如在线检索)进行内容生成时,支持给出引用标签,生成内容有据可依
【日日新-商量大语言模型-代码生成】V4代码小浣熊
- OpenAI HumanEval 测试集一次通过率 71%,超过GPT4 的 67%
- 中文理解能力加强,更适应中国的开发者使用场景
- 超大训练样本支持生成高质量的代码
- 支持Python、C#、C/C++、Java、 Go、JavaScript 等90多种主流编程语言
【日日新-商量大语言模型-数据分析】V4办公小浣熊
- 场景精度超过GPT4:在1000+测试集上略胜于GPT4(85.71%,优于GPT4的84.62% )
- 支持多种表格和文件类型的理解,支持复杂表格处理
- 中文理解能力加强,更适应中国的数据分析需求
- 支持32K超长上下文
【日日新-商量大语言模型-医疗版本:“大医”】V4API + 体验中心
- 更强的多轮对话与上下文理解能力
- 更丰富的工具调用能力,支持搜索、医学数据分析计算等,实现复杂医学任务处理
- 支持更多模态医学文件的智能解读和交互问答,如医学检查报告、药品照片智能分析
- 在两项行业权威的第三方评测——2023年职业药剂师考试大模型评测和中文医疗大语言模型开放评测平台MedBench中,“大医”在众多通用及医疗垂类大语言模型中综合能力评分排名第二,性能逼近GPT-4。在职业药剂师考试大模型评测的两个细分方向上,“大医”表现更是超越了GPT-4
【日日新-商量图文多模态大模型】V4 API + 体验中心
- 图文感知能力达到全球领先水平,在多模态大模型权威综合基准测试MME Benchmark中综合得分排名首位
- 基于海量的图文数据采用预训练和监督微调的方式,可以处理多种类型的任务,包括常规的图文任务和开放式的长尾任务
- 支持多模态领域的多项通用视觉语言任务,如:图像描述、目标检测、视觉问答等
- 支持智能驾驶、智能车舱、电力行业等多个实际场景应用,助力千行百业的产业升级
【日日新-秒画文生图大模型】V4 API
- 模型参数量提升:高效数据清理策略增量至10亿+图文对,参数量提升至百亿量级
- 推理算法优化:优化模型Turbo版本,结合Adversarial Distillation,推理达到10倍加速效果
- 画面表现提升:结合Mixture of text experts、Spatial-aware CFG等算法,大幅度提升语义理解与图像质感细节表现,画面更具表现张力
2024.02.02
【服务更新】Function Call 函数调用Beta
- 对话生成支持函数调用(Function Call)能力,用户可将外部函数的定义通过接口参数传入,指定模型生成调用参数(Json Format)
- 适用场景:通过对话形式发起外部指令的相关场景,例如通过语音助手设置闹钟、打开APP、创建流程、发送邮件等
- 接口文档:函数调用
2024.02.02
【服务更新】Assistants 构建Beta
- 通过API快速构建用户专属的Assistant