我的主页

看不懂我吃屎系列——CTPN

CTPN 主要是作用是来检测图片上的文字对象,并画一个框出来,目的是画出可能是文字的框,下一步的输入可以是ocr识别, 先说一下他的网络结果, 其很就是在FasterRCNN的基础上增加一个RNN的结构,看了一下之前的FasterRCNN好像 有些没说明白,这次全部写了。从结构到代码。结合代码说原理。它的大结果快主要有VGG,RNN,RPN 分类回归,非 极大值抑制用来处理最终预测结果...

看不懂我吃屎系列——YOLO-V3

数据 依然是目标检测,画框和识别框中的物体,同时以coco数据为例,首先确定有80个类别,也就是说一张图片最多包含80个类别的物体 数据就是图像数据,标签是每个框中物体的中心点坐标和宽高和类别。 网络结构 前面都是卷积网络,就是特征提取,后面会对特征图进行连接和残差操作,就是有些特征直接连接,有些特征需要进行叠加,然后需 要3中不同的尺度,每种尺度都会对应不同效果。 首先选择特征提取网络...

看不懂我吃屎系列——FasterRCNN

看到不懂我吃屎 先整体介绍一下,他是干嘛的,和前提条件,输入时啥输出是啥,然后分别详细介绍,每个功能块的作用,最后介绍如何将这些功能块连接起来,需要看 代码,代码是最好理解原理的方法 整体功能 FasterRCNN主要是是用来做目标检测,具体说就是一张图片上有多个物体,FasterRCNN可以将物体以矩形框的形式框出来同时识别出框出来的物体是啥。 但是前提是,首先是固定的物体类别,不能有未...

看不懂我吃屎系列——GAN

GAN的常识性原理 对于一个生成模型,大部分情况下就是样本的分布模型。通常情况下一个生成模型相当于一个分布转化器,我们有训练 样本的采样数据,通过生成模型将这个数据可以转化为领一个分布的采样数据,这就是生成器。单独训练生成器,需要 人为指定标签,但是GAN就不用了,它让机器自己指定。 GAN分为两个阶段,首先第一个是判别阶段我们需要判别器能判别出,哪些数据是实际数据哪些数据是生成器生成 的数...

看不懂我吃屎系列——CTC

CTC的作用 CTC就是对于不定长序列计算损失的方法,为啥会有不定长序列,比如一段语音,这段语音是可以是定长的但是语音的内容可能是不定长的 有时候是3个字有时候是4个字,这时候我们需要计算损失就会用到CTC。 CTC主要有几个条件,首先输出序列的长度不能超过输入的长度,其次一个输出序列中时间步长间是相互独立的,简单来说就是可以随便相 乘,最后一个限制就是强制让其输出与输入一 一对应,现实中...

kaggle竞赛总结分析(没有取得很好的名次)

微软恶意攻击预测 微软的一个数据集给出电脑的特征信息包括编号版本等给出是否受攻击的标签, 通过这些数据训练一个模型可以预测电脑是否会收到攻击。这是题目要求, 评判标准是Roc曲线面积,输出类别概率。 记录我敲代码和思路过程和总结 首先正对数据集第一步要做的事对数据进行分析,也就是特征工程,分析数据的 时候发现数据中有很大一部分标签量,型号量等,这些量必须经过编码转化,才 能让模型...

python注意事项

文件读取 当按行读取文件的时候 如果想在文本中一行行的读取文本, 可以使用 file.readline(), file.readline() 读取的内容和你使用的次数有关, 使用第二次的时候, 读取到的是文本的第二行, 并可以以此类推: file= open('my file.txt','r') content=file.readline() # 读取第一行 print(conten...

python,LR,SVM GM

Python 类里的__int__表示构造器,调用这个类时第一步执行这个相当于类的一个初始化 @的用法 @dec2 @dec1 def func(arg1, arg2, ...): pass 上面等价于下面 def func(arg1, arg2, ...): pass func = dec2...

论文实现:python计算MACD值以及ADF检验及数据分析

这段代码主要是实现了一篇关于交易股票算法的论文上提到的方法,论文上说这个方法基本上可以赚钱,好像很吊的样子 数据读取 import pandas as pd import numpy as np import datetime import time #获取数据 def csv_read(): df=pd.read_csv('mcad.csv') df.columns=[...

基于Lasso回归的涨跌预测

数据 tushare提供了全面的金融数据,可以直接调用api来获取数据,需要在python环境下安装anaconda 直接pip install tushare就可以了,然后调用函数既可以获得数据,该数据集下的数据主要有股票 的变化情况和参数, 目标 用每天的数据来预测三天后的涨跌幅度 用r2来检测算法的效果,在sklearning是实践经验证r2值完全不到0.1%, python...