ChatGPT是领域由OpenAI开发的一种大型语言模型,它使用了Transformer架构,在大量现实世界文本数据上训练,以捕捉人类语言的复杂性和多样性 。能够实现许多人工智能语言处理任务,如回答问题、应用进行翻译、初测修改代码、领域生成文档、应用文本等。初测该模型于2022年11月底发布,在几天之内用户数突破百万。领域截止目前,发布两个月,月活用户数已超过1亿 。应用每天对于ChatGPT的初测报道铺天盖地,各大厂商纷纷布局。本报告将对ChatGPT体系结构 、领域工作原理进行介绍,并结合实际使用体验,分析其在亮点与局限,以及在GIS领域的应用应用前景与可行性。
ChatGPT是初测语言生成模型 、预训练语言模型和AI技术在自然语言处理领域的领域综合研究,旨在推动自然语言处理技术的进展,提供一种可以在多种NLP任务上取得卓越表现的模型。该模型的应用训练机制可分为三个阶段:
第一阶段:训练监督策略模型
GPT 3本身很难理解人类不同类型指令中蕴含的不同意图,也很难判断生成内容是否是高质量的结果 。为了让GPT 3.5初步具备理解指令的初测意图,研究人员首先会在数据集中随机抽取问题,由人类标注人员给出高质量答案,然后用这些人工标注好的数据来微调 GPT3模型获得SFT模型(Supervised Fine-Tuning) 。此时的SFT模型在遵循指令/对话方面已经优于 GPT-3,但不一定符合人类偏好