孟子 GPT 大语言模型 | 澜舟科技-业界领先的认知智能公司

孟子 GPT 大语言模型

孟子 GPT 大模型是基于团队自研技术研发的大规模语言模型，可处理多语言、多模态数据，同时支持多种文本理解和文本生成任务，能快速满足不同领域、不同应用场景的需求。孟子是国内著名的大模型品牌，多次在中文大模型基准评测，例如 C-EVAL、SUPERCLUE 等取得优胜成绩。孟子大模型已于 2023 年底通过网信办生成式人工智能备案，并已正式面向公众开放服务。

通过问答的方式帮助用户直接获取所需要的信息，无需再做搜索和筛选

能够按照用户的要求撰写多种类型、题材的文章，并通过自然语言对话来控制内容创作的效果

在对话中实现多语言的翻译，相比传统翻译效果更加流畅自然

针对金融场景的特殊任务进行模型优化，帮助行业工作者能够更高效的完成工作

在给定文档中查找答案，并回答用户关于文档内容的问题

技术方案

mengzi-advantage

支持多种模型架构

自回归模型：如 GPT
自编码模型：如 BERT
Encoder-Decoder 模型：T5

mengzi-advantage

轻量模型性能强化

多预训练任务融合
SMART 对抗训练
知识蒸馏

mengzi-advantage

基于知识图谱增强

基于实体抽取的增强
知识图谱增强（isa 关系）
知识图谱转文字

mengzi-advantage

基于语言学知识增强

成分句法融合增强的 Mask 机制
语义角色 Embedding 融合增强
依存关系的注意力权重约束剪枝

mengzi-advantage

小样本/零样本学习

Prompts 模板构造
多任务学习技术
覆盖常见信息抽取场景，开箱即用

mengzi-advantage

基于检索增强

知识解耦
可解释性强
外部知识组件实时更新

技术优势

advantage

在金融知识图谱搭建、研报脱水、公告抽取等多个任务上获得了超过常规模型的表现

advantage

支持 BERT、GPT、T5 等架构，能够覆盖文本理解、文本生成等不同场景

advantage

支持图文双模态输入，能够更好地处理图文相关任务

advantage

支持对垂直领域进行快速定向优化，支持从 10M 到 1B 不同规模

能力资质

C-Eval 排行榜

*排名截止2023年8月

#	0	1	2	3	4
模型名称	Mengzi	ChatGLM2	InternLM-123B	GPT-4*	AiLMe-100B v2
发布机构	澜舟科技	Tsinghua & Zhipi.AI	Shanghai AI Lab & Sense Time	OpenAI	APUS
提交时间	2023/8/25	2023/6/25	2023/8/22	2023/5/15	2023/7/25
平均	71.5	71.1	68.8	68.7	67.7
平均(Hard)	48.8	50	50	54.9	55.3
STEM	62.3	64.4	63.5	67.1	65.4
社科文学	87.2	81.6	81.4	77.6	72.3
人文科学	76.8	73.7	72.7	64.5	71.2
其他	68.6	71.3	63	67.8	64

#	模型名称	发布机构	提交时间	平均	平均(Hard)	STEM	社科文学	人文科学	其他
0	Mengzi	澜舟科技	2023/8/25	71.5	48.8	62.3	87.2	76.8	68.6
1	ChatGLM2	Tsinghua & Zhipi.AI	2023/6/25	71.1	50	64.4	81.6	73.7	71.3
2	InternLM-123B	Shanghai AI Lab & Sense Time	2023/8/22	68.8	50	63.5	81.4	72.7	63
3	GPT-4*	OpenAI	2023/5/15	68.7	54.9	67.1	77.6	64.5	67.8
4	AiLMe-100B v2	APUS	2023/7/25	67.7	55.3	65.4	72.3	71.2	64

CLUE 排行榜

*排名截至2021年7月30日

排名	1	2	3
模型	孟子	Motian	BETRTSG	人类水平
规模	十亿	十亿	百亿
总分	82.90	82.15	81.80	86.68
AFQMC	79.82	78.30	79.85	81.00
TNEWS	64.68	57.42	57.42	71.00
IFLYTEK	65.08	65.46	64.54	80.30
OCNLI	81.87	84.97	85.93	90.30
WSC2020	96.55	94.83	95.17	98.00
CSL	89.87	90.17	89.00	84.00
CMRC2018	82.25	85.30	83.80	92.40
CHID	96.00	94.43	93.06	87.10
C3	89.98	88.49	87.44	96.00

排名	模型	规模	总分	AFQMC	TNEWS	IFLYTEK	OCNLI	WSC2020	CSL	CMRC2018	CHID	C3
1	孟子	十亿	82.90	79.82	64.68	65.08	81.87	96.55	89.87	82.25	96.00	89.98
2	Motian	十亿	82.15	78.30	57.42	65.46	84.97	94.83	90.17	85.30	94.43	88.49
3	BETRTSG	百亿	81.80	79.85	57.42	64.54	85.93	95.17	89.00	83.80	93.06	87.44
	人类水平		86.68	81.00	71.00	80.30	90.30	98.00	84.00	92.40	87.10	96.00

备案情况

大模型备案号	Beijing-MengZiGPT-20231205
网信算备	110108396388101240013号
网信算备	110108396388101240021号

落地场景

scene

公告抽取

模型可以从大量的文本中提取出公告信息，方便快速获取重要信息。

scene

小说生成

模型可以根据用户提供的信息，自动生成小说内容。

scene

情感分类

模型可以对文本进行情感分析，区分出文本中的正面、负面或中性情感。

scene

研报分类

模型可以对研究报告进行分类，按照不同的主题进行归类。

scene

新闻摘要

模型可以自动生成新闻摘要，快速提供新闻要点信息。

scene

知识图谱搭建

模型可以根据已有的知识，构建知识图谱，方便快速查询。

scene

问答系统

模型可以通过语义分析，提供问题的答案。

scene

图文互检

模型可以对文本和图片进行匹配，检查是否相符。

商务合作邮箱

公司地址

北京市海淀区北四环西路（街）52 号方正国际大厦 16 层 1603

地址:

北京市海淀区北四环西路（街）52 号方正国际大厦 16 层 1603

公众号:

ewm

孟子 GPT 大语言模型 | 澜舟科技-业界领先的认知智能公司

技术方案

技术优势

能力资质

C-Eval 排行榜

CLUE 排行榜

备案情况

落地场景

公告抽取

小说生成

情感分类

研报分类

新闻摘要

知识图谱搭建

问答系统

图文互检

Amp

讯飞绘镜

评论 0

最佳AI工具目录&产品查找器_AIBase

AIBase基地

Devin Desktop

heyCLI - your copilot for linux commands

Visual Studio IntelliCode | Visual Studio - Visual Studio

注册立享价值上万元的新人专属礼包

技术方案

技术优势

能力资质

C-Eval 排行榜

CLUE 排行榜

备案情况

落地场景

公告抽取

小说生成

情感分类

研报分类

新闻摘要

知识图谱搭建

问答系统

图文互检

Amp

讯飞绘镜

相关文章

最佳AI工具目录&产品查找器_AIBase

AIBase基地

Devin Desktop

heyCLI - your copilot for linux commands

Visual Studio IntelliCode | Visual Studio - Visual Studio

HTTPie AI — a new way to interact with APIs

评论 0

注册立享价值上万元的新人专属礼包