- Published on
All Posts
- Published on
自回归和自编码模型在自然语言处理中的应用,以及BERT、GPT等大型语言模型的发展。文章重点讨论了BERT及其变体(如ALBERT、RoBERTa等)的改进,以及GPT、XLNet等自回归模型的特点。最后,文章简要概述了大型语言模型(LLM)的发展历程及其在NLP任务中的应用前景。- Published on
这篇文章主要介绍了强化学习的基本概念和定义。文章解释了概率密度函数、期望、状态、动作、策略、奖励等基础术语,并定义了回报、折扣回报、动作价值函数、最优动作价值函数和状态价值函数等关键概念。文章还通过马里奥游戏的例子来具体说明这些概念在实际应用中的含义。- Published on
- Published on
Python文件操作和多进程编程的一些技巧。文章讨论了如何处理文件读取时的换行符和编码错误,介绍了Python的-u选项用于关闭输出缓冲,并提供了设置pip源的方法。最后,文章展示了一个使用多进程写文件的Python代码示例。