首页 > AI前沿 > 正文

五行代码玩转GPT-2,新加坡高中生开源轻量级GPT-2“客户端” 五行代码文本生成 食用指南 传送门

转载 2019-08-12 0 9

OpenAI会讲故事的文本生成模型GPT-2,现在有了更易用的封装版本。

轻松上手轻量级速度快。这就是这只名叫gpt2-client的包装器的突出特性。

五行代码玩转GPT-2,新加坡高中生开源轻量级GPT-2“客户端”

作者小哥 Rishabh Anand 表示,gpt2-client 简化了整个文本生成过程,有了它,任何人都可以毫不费力地开始使用文本生成模型。

Rishabh Anand 小哥来自新加坡国家初级学院,是的你没看错,这是一位高中生。

gpt2-client 是 GPT-2 原始仓库的包装器。OpenAI 带来的功能,gpt2-client 一样能实现,并且这个“客户端”更具可访问性,可理解性,也更加易用。

不管是 117M(小型)GPT-2 模型,还是拥有15亿参数的 345M(中型)GPT-2 模型,都能在五行代码以内轻松玩转。还能用轻松适配自定义数据集。

就像这样。

五行代码玩转GPT-2,新加坡高中生开源轻量级GPT-2“客户端”

实测几分钟之后,GPT-2就开始编故事了。

五行代码玩转GPT-2,新加坡高中生开源轻量级GPT-2“客户端”

难怪网友会说,这真是令人难以置信:

五行代码玩转GPT-2,新加坡高中生开源轻量级GPT-2“客户端”

Rishabh Anand 还放出了 Colab 在线 Demo,涵盖了gpt2-client的基本功能,打开浏览器即可食用。

一起来看看效果。

输入一个提示:In latest news(最新消息)

想要亲自体验一下 gpt2-client,并不困难。

Python 版本 ≥ 3.5,TensorFlow 版本 ≥ 1.X,就能得到完美支持。如果选择Python 2.X,那么可能需要重新安装或升级某一些库。

首先,还是 pip 安装:

pip install gpt2-client

下载模型权重和检查点:

from gpt2_client import GPT2Client
gpt2 = GPT2Client(’117M’, save_dir = ‘models’)# 想用 345M 模型,就换成 ‘345M’
gpt2.download_model(force_download = False)# 使用缓存(如果有)。将 force_download 设置成 true 能重新下载文件

经过这一步,当前工作目录中会生成一个名为 models 的新目录,并下载模型所需的权重,检查点,模型 JSON 和超参数。一旦调用了download_model()函数,就假设文件已经在 models 目录中下载完成,无需再次调用。

接着就可以开始生成文本了:

from gpt2_client import GPT2Client
gpt2 = GPT2Client(117M’) # 可以是 345M
gpt2.generate (interactive=True) # 要求用户输入提示
gpt2.generate (n_samples=4) # 生成 4 个文本片段
text = gpt.generate (return_text=True) # 生成文本并返回 array
gpt2.generate (interactive=True, n_samples=3) #每次都有不同提示

生成选项非常灵活,可以根据需要生成的文本类型进行混合和匹配。

最后,根据自定义数据集微调 GPT-2。

from gpt2_client import GPT2Client
gpt2 = GPT2Client (‘117M’)
my_corpus = ‘./data/shakespeare.txt’
custom_text = gpt2.finetune (my_corpus, return_text = True) # 加载自定义数据集

这一步最好是用上 GPU 或 TPU,也可以试试Google Colab。

五行代码玩转GPT-2,新加坡高中生开源轻量级GPT-2“客户端”

最后,再多说一句,Rishabh Anand 小哥还是个写博客小能手,感兴趣的话可以 follow 他哟。

GitHub地址:

https://github.com/rish-16/gpt2client

Colab在线调教地址:

https://colab.research.google.com/drive/1RZwp1n6XeWxvhBjt1e3ATSOy4Mj9GEEl

Rishabh Anand 博客:

https://medium.com/@mail.rishabh.anand

— 完 —

版权所有,未经授权不得以任何形式转载及使用,违者必究。

相关文章


  • 汉堡王已开始供应“人造肉”汉堡
  • 孙正义透露:软银愿景基金2号最早下月开始投资,专注AI领域
  • Facebook申请被驳回,面部识别将面临集体隐私诉讼
  • 余承东回应鸿蒙OS十大疑云:人都是被逼出来的
  • 免费数学神器有了手机版,再复杂的公式,拍照就能转成LaTeX 不仅仅只有手机版 谁做的这个工具?
  • GitHub万星资源:强化学习算法实现,教程代码样样全,还有详细学习规划 清晰的学习路径 实现算法列表
  • 腾讯极客攻破iPhone刷脸解锁,凭一副眼镜,转走熟睡用户的钱 戴眼镜的漏洞
  • 旷视5号员工陈可卿:1991生于绍兴、10岁买电脑改变命运,信息奥赛金牌保送清华 天才少年启航:兴趣是第一任老师 痴迷于编程 “卿沐组合”:旷视“超级英雄” 第一次蜕变:追求极致,暴走成长 第二次蜕变:最靠谱的产品经理 第三次蜕变:做英雄联盟的一块砖 从个人成长到集体成长 陈可卿背后:组织的成长才是本质