论文阅读-双塔模型 - 个人主页

模型

Embedding-based Retrieval in Facebook Search 两个模型输出两个结果

Triplet loss 一个模型输入query 另一个模型输入正负样本doc

数据构建有门道

正负样本的构建负样本有两种选择 1从召回结果中选择未点击的属于hard-case 2随机采样一个数据，直观上hard-case作为结果似乎训练的模型更优秀，但是实际上hard-case为模型
添加了一种偏差，导致识别不准，反而随机采样的结果才准

正样本构建使用点击的或者排序靠前数据的数据作为正样本，实验结果是一样的

FEATURED TAGS

c语言 c++ 面向对象指针容器 python 函数数据结构回归损失函数神经网络机器学习似然函数极大似然标准化深度学习卷积网络参数估计 beta分布数据处理 gradio 模型工程化网页模型加速工具 c++实现变量占位符 tensorflow 线性回归学习tensorflow HMM RNN 强化学习 LSTM pandas 不定长序列损失 pytorch 目标检测 RPN 非极大值抑制 ROIpooling VGG16 Transformer BERT Python 装饰器方法 Pytorch FPN 图像分类 CNN 多模态生成 GPT Tranformer 生成模型 audio

模型

数据构建有门道

CATALOG

FEATURED TAGS