存档

2021

运用 BERT 的 MLM 模型进行小样本学习

从 PET 到 P-tuning


GlobalPointer:用统一的方式处理嵌套和非嵌套NER

更漂亮、更快速、更强大


Transformer 位置编码

Transformer 升级之路


将“softmax+交叉熵”推广到多标签分类问题

媲美精调权重下的二分类方案


将 PyTorch 版 bin 模型转换成 Tensorflow 版 ckpt

Pytorch bin to Tensorflow checkpoint


2020

改变世界的25天:新冠疫情是如何在中国失控的?

科学只能实事求是,不能明哲保身


文本生成评估方法简介

用Python计算文本BLEU分数和ROUGE值


Seq2Seq 中 Exposure Bias 现象的浅析与对策

最优序列并不一定是目标序列


CRF or MEMM?

CRF 用过了,不妨再了解下更快的 MEMM


浅谈泛化性

从随机噪声、对抗训练到梯度惩罚


方方的武汉日记

该滚去美国的卖国贼?


中国和美国都把对方最大的弱点当成了唯一

超级大国没有内外之别


2019 机器学习与 NLP 年度盘点

10 ML & NLP Research Highlights of 2019


我对中国科技行业的看法(译文)

2019年回顾


统计自然语言处理之美

从 NNLM 到 Bert


中东百年往事

欺骗、斩首、革命


2019

关于当代中国发展的哲学反思

发展的代价正成为新的社会命题


依存句法分析在深度学习中的应用

从 Tree-LSTM 到 GCN


从 Word Embedding 到 Bert 模型

自然语言处理中的预训练技术发展史


重磅调查:寻找中国毒枭

芬太尼是如何从中国流向美国的?


专访周永康:这场运动激活了香港,在痛苦中打开未来

对理想香港的追求、对现况的极度不满


中国网民,地球上收入最高的群体

当代互联网用户画像:年薪 30 万,人均 985


Transformer 如戏,全靠 Mask

从语言模型到 Seq2Seq


使用 Keras 搭建模型识别验证码

通过 Web API 提供识别服务


Keras 使用技巧

一个极其友好、极其灵活的高层深度学习 API 封装


Seq2Seq 模型入门

NLP 与深度学习结合的经典之作


基于 DGCNN 和概率图的轻量级信息抽取模型

膨胀门卷积神经网络


基于CNN的阅读理解式问答模型:DGCNN

膨胀门卷积神经网络


Windows 10 系统上的 Python 开发环境配置

使用自带 Linux 子系统进行 Python 开发


BERT 浅析

快速上手使用 BERT


香港到底赢了什么?

制度维护者问反修例


好一个孙宇晨,连巴菲特也不放过

巴菲特首个90后饭友


八九春夏,其实发生的是“两场运动”

边缘化的六四论述


Vue.js 快速入门

真的很好用


2018

Keras深度学习笔记(四):机器学习基础

模型评估与正则化


从变分编码、信息瓶颈到正态分布

论遗忘的重要性


Keras深度学习笔记(三):神经网络入门

层、网络、目标函数和优化器


Keras深度学习笔记(二):神经网络的数学基础

张量运算、微分和梯度下降


变分自编码器 VAE

Variational Auto-Encoder


为什么中国进口药的价格如此昂贵?

天价进口药的诞生过程


Keras深度学习笔记(一):什么是深度学习

人工智能、机器学习以及深度学习


互怼的艺术:从零直达 WGAN-GP

GAN 简介


美国小镇行

COLING 2018 圣达菲


给历史一个交代

跨度三十年三位老男人记录的信号与噪声


iOS 证书简介

快速了解 iOS 证书体系


纳粹心灵控制器

Volksempfänger的黑历史


中国为什么克美国?

“故宫体系”的根本优越性


儿童节的背后

利迪策惨案


灾后北川残酷一面

汶川大地震最好的记录和纪念


奶奶走后,家就散了

大家庭的瓦解


重点班的女孩,撬开了教务处的大门

中国教育制度


决策树

信息增益、增益率和基尼指数


无约束优化

梯度下降、牛顿法和拟牛顿法


朴素贝叶斯分类器

假设所有属性相互独立


深度学习中的优化方法

梯度下降和约束优化


概率与信息论基础(下):常用概率分布和信息熵

Bernoulli分布、高斯分布与交叉熵


概率与信息论基础(上):基础概念

概率分布、期望与方差


矩阵Capsule与EM路由

使用 GMM 来完成聚类


Jupyter Notebook 快速入门

创建漂亮的交互式文档


机器学习基础(五)

监督学习算法和随机梯度下降


机器学习基础(四)

最大似然估计和贝叶斯统计


从K-Means到Capsule

深入解读动态路由


三点钟无眠区块链

人有病,天知否?


Capsule 胶囊网络入门

用聚类的思想来理解动态路由


机器学习基础(三)

交叉验证和参数估计


机器学习基础(一)

学习算法


机器学习基础(二)

容量、过拟合和欠拟合


一张烈士证明书引发的死刑


那些被送进戒网瘾学校的孩子

正义可能会迟到 但永远不会缺席


浅谈 NLP 中的 Attention 机制

Google 的“大道至简”


加密货币的本质

为什么比特币可以成为钱


比特币入门教程

比特币的原理与交易


2017

从 loss 的硬截断、软化到 focal loss

通过 Loss 函数缓解数据不平衡问题


区块链入门教程

快速了解什么是区块链和挖矿


Fork Join:Java 并行编程

轻松实现 Java 多线程


果壳中的条件随机场

CRF In A Nutshell


更别致的词向量模型:simpler glove(上)

自己构建词向量模型


更别致的词向量模型:simpler glove(下)

模型结果与代码实现


使用 Keras 开发词语级自然语言模型

使用 LSTM 学习词语序列


构建编码器解码器模型实现 Seq2Seq 预测

使用 Keras 实现 Sequence-to-Sequence


不可思议的 Word2Vec(下)

用 Tensorflow 和 Keras 来实现 Word2Vec


Ubuntu深度学习环境搭建

安装Cuda、CuDNN、TensorFlow


白话蒙特卡洛树搜索和 ResNet

一文读懂AlphaGo Zero算法


不可思议的 Word2Vec(中)

提取关键词与词语相似度


不可思议的 Word2Vec(上)

Word2Vec 的基本原理


用 Keras 实现验证网络 siamese

keras示例程序解析


编译安装 TensorFlow

开启加速指令,充分调用起你的硬件


LSTM 网络原理

通过图解,一步一步“走过”LSTM


2017 年 ACL 的四个 NLP 深度学习趋势

语言结构 词语表达 可解释性 注意力


Deep Learning 学习笔记(下):常用模型

深度学习的常用模型和方法


Deep Learning 学习笔记(中):神经网络

如何训练深度网络


Deep Learning 学习笔记(上):深度学习简介

什么是深度学习


在 Keras 模型中使用预训练的词向量

通过预训练的词向量引入外部语义信息


Keras 快速上手指南(下):网络配置与数据预处理

设定网络中的损失函数、优化器、激活函数


Keras 快速上手指南(中):模型与网络层

如何使用序贯模型和函数式模型,如何定义各种网络层


Keras 快速上手指南(上):Keras 入门

通过Keras开始我们的深度学习之旅


让你的 Python 代码优雅又地道

教你如何写出pythonic的代码


深度学习之自然语言处理

运用深度学习向语义层面的理解迈进


RNN 循环神经网络(下):长期依赖的挑战与长短期记忆

对 LSTM 和 GRU 的简单介绍


RNN 循环神经网络(中):常见的网络架构

实际应用中常见的循环神经网络架构


Docker 快速入门

第一个Docker化的Java应用


MongoDB 权限管理

裸奔很快乐,后果很严重


浅谈集成学习:Boosting与随机森林

把多个学习器结合起来提高性能


浅谈词向量

n元模型与word2vec


RNN 循环神经网络(上):计算图与网络设计模式

循环神经网络的三种经典结构


统计语言模型

用数学的方法理解语言


CNN 卷积神经网络(中):基本卷积函数的变体

神经网络中的卷积


CNN 卷积神经网络(下):实践中的细节

使用卷积神经网络的要点


DeepNLP的表示学习

自然语言处理入门


维基百科中文语料库词向量的训练

处理维基百科中文语料


Python 下解析 XML

比 DOM 更好的 ElementTree


CNN 卷积神经网络(上):卷积与池化

卷积与池化是一种无限强的先验


理解深度学习中的卷积

深入理解卷积的物理意义


神经网络(下):反向传播算法的说明和深度学习

开启深度学习的大门


神经网络(中):多层前馈神经网络与反向传播算法

如何学习到网络中权值


神经网络(上):神经元与感知机

使用计算机来模拟生物神经系统


SVM 支持向量机(下):非线性型

核函数和软间隔


SVM 支持向量机(上):基本型

支持向量和 SMO 算法


线性回归、Logistic 回归和感知机

线性模型


CRF 条件随机场

使用 Viterbi 算法寻找最优标注序列


产生式模型与判别式模型

建模对象是最大的不同


TextRank算法提取关键词和摘要

把PageRank运用到自然语言处理上


Python 多进程、多线程(上)

让你的程序飞起来吧


Python 多进程、多线程(下)

让你的程序飞起来吧


HMM 隐马尔可夫模型(下)

使用 Viterbi 算法寻找隐藏状态


HMM 隐马尔可夫模型(上)

看见不可见


Java异常处理的误区和经验总结

关于异常处理的基础知识


模型评估与模型选择

评估方法与性能度量


Python 盒子:模块、包和程序

程序组织结构与标准库


正则表达式入门

强大的字符匹配工具


NumPy 快速入门

让矩阵运算变得简单


信息的度量和作用

信息论基本概念


机器学习构成三要素之特征

特征:机器学习的马达


机器学习构成三要素之模型

模型:机器学习的输出


机器学习构成三要素之任务

任务:可通过机器学习解决的问题


机器学习概述

简单的二元分类器


程序员的自我修养(三):fork() 安全

慎重使用多进程和多线程混搭的模型


程序员的自我修养(二):操作系统、进程与线程

进程是什么


程序员的自我修养(一):计算机硬件架构的发展

浅谈计算机硬件结构


LDA 入门

预测文档的主题


使用 LaTeX 编辑数学公式

优雅地展示数学公式


Spring MVC 快速入门

快速开发一个Java网站


2016

C# 使用 Json.NET 解析 Json

Json.NET 简易指南


MongoDB C#驱动快速上手指南

使用C#操作MongoDB


MongoDB数据库设计中6条重要的经验法则,part 2

MongoDB设计经验


MongoDB数据库设计中6条重要的经验法则,part 1

MongoDB设计经验


MongoDB数据库设计中6条重要的经验法则,part 3

MongoDB设计经验


一图看懂笔记本配置在讲啥

小白秒变大牛


LIBSVM使用说明(下):寻找最优参数

LIBSVM使用指南


LIBSVM使用说明(中):函数和Python接口

LIBSVM使用指南


LIBSVM使用说明(上):介绍和安装

LIBSVM使用指南


如何步步为营 通过线下理财3年骗100亿?

骗子必读教程


使用SSH协议登录Linux服务器

连接远程服务器


2015

Tesseract训练

提高识别准确率


通过Tesseract实现简单的OCR

光学字符识别


Flatabulous:优秀的扁平化Ubuntu主题

系统美化


GNU/Linux与开源文化的那些人和事

Just for Fun


我们都爱上了朋友圈里的虚伪?

微信圈已变成了一个扰人的虚拟空间


Mac修改主机名和计算机名

OS X 下主机名和计算机名是不同的概念


Linux下C语言实现Copy复制命令

自己编程实现 cp 命令


Linux下编译C程序

Linux基础