All Posts

Published on
January 15, 2023
GPT3
AI
GPT-3是一个拥有1750亿参数的大型语言模型,通过增大模型规模显著提高了小样本学习能力。在问答、填空、翻译等多项任务上,GPT-3无需微调就能取得不错的性能,但在某些数据集上仍存在困难。该研究还探讨了如何在大规模数据上训练如此庞大的语言模型。
Published on
January 15, 2023
自编码-自回归_BERT-GPT-LLM_
AI
自回归和自编码模型在自然语言处理中的应用,以及BERT、GPT等大型语言模型的发展。文章重点讨论了BERT及其变体(如ALBERT、RoBERTa等)的改进,以及GPT、XLNet等自回归模型的特点。最后,文章简要概述了大型语言模型(LLM)的发展历程及其在NLP任务中的应用前景。
Published on
January 4, 2023
Reinforcement_Learning
AI
这篇文章主要介绍了强化学习的基本概念和定义。文章解释了概率密度函数、期望、状态、动作、策略、奖励等基础术语，并定义了回报、折扣回报、动作价值函数、最优动作价值函数和状态价值函数等关键概念。文章还通过马里奥游戏的例子来具体说明这些概念在实际应用中的含义。
Published on
August 8, 2022
笔记-产品经理
Product
这篇文章主要讨论了产品经理的工作内容和方法。文章涵盖了验证码设计、需求变更管理、产品规划、与开发人员合作、文档编写等多个方面。文章强调了产品经理需要深入理解用户需求,关注产品场景,善于沟通和管理项目,并且要不断学习新技术。总的来说,文章为产品经理提供了全面的工作指导和建议。
Published on
April 20, 2022
python_cookbook
Ongoing
Python文件操作和多进程编程的一些技巧。文章讨论了如何处理文件读取时的换行符和编码错误，介绍了Python的-u选项用于关闭输出缓冲，并提供了设置pip源的方法。最后，文章展示了一个使用多进程写文件的Python代码示例。

All Posts

All Posts

GPT3

自编码-自回归_BERT-GPT-LLM_

Reinforcement_Learning

笔记-产品经理

python_cookbook