Yougth Blog

大神养成中.....

线性回归多重共线性优化

线性回归终极优化

问题引入 之前分析了线性回归问题的解法,最小二乘回归法,但是对于大多数的实际问题,由于我们要用有限的观测值去估计模型的分布,比如在之前讲线性回归中的例子,给出的样例有100对,而我们建立的模型是一条直线,我们都知道两点确定一条直线,这里有100个点,这种称作过度确定估计,同时很多样例由于各种原因本身存在误差,另一个方面是特征之间相关性很大,说白了就是两个特征之间存在关系,本身可以用一个变量...

逻辑回归

loggit

继续机器学习系列基础算法,逻辑回归 定义问题 首先我们依然是定义问题,逻辑回归是解决分类问题,而且是基本的二分类问题,比如经典的垃圾邮件判定,根据疾病的特征预测死亡率。比如现在我给出这样一个问题,基于邮件的两个特征值去判定邮件是不是为垃圾邮件,根据数据画出的分布图如下。蓝色表示不是垃圾邮件,红色表示是垃圾邮件,我们要做的是学习去拟合一个分类决策边界,然后就能根据这个模型预测。 逻辑回归分...

寻物启事

looking for

寻物启示 2017年10月29日晚上九点半左右本人人在灵武市医院急诊科到门诊部附近丢失一个棕色的长款钱包,里面有现金七千多元 还有本人身份证,银行卡会员卡等证件对于本人很重要,望好心人尽快与本人联系,现金可作为答谢,只要里面证件。 备注 钱是给宝宝看病的 家人特别着急 往好心人帮忙 看到帮忙转发一下 好人一生平安 联系人:杨亮叶 联系电话:18995151694 ...

推荐系统中遇到的问题及思考

zsh的快速配置

2019年算起来已经过去了半年,回想这半年做的事情,因为18年底重新做了新推荐引擎,好像全部在找bug中了,在遇到了一堆的坑之后发现效果依然上不去,记录一些我的思考。 推荐系统越来越变成一个机器学习系统了 这一点不用我说,应该都有这个感觉,最早的推荐就是cf了,通过同一个用户群中点击了某一个物品的可能会点击用户群中其他用户喜欢的物品,或者这个共同被点击的物品集合,点击率其中某一些的可能会...

推荐系统中遇到的问题及思考

zsh的快速配置

2019年算起来已经过去了半年,回想这半年做的事情,因为18年底重新做了新推荐引擎,好像全部在找bug中了,记录一下推荐系统中会遇到的坑。 特征穿越 自动换到新引擎之后, 客户上报数据 item session积累不同场景是否应该积累到一起 当发生上报数据重复 数据上报序列不一致,比如先上报点击后上报展示 数据上报延迟 推荐引擎模型打分模块设计思考 对特征序列...

2018年终总结

总结&规划

学算法 预期结果: 从经典算法学起,学习10个工作相关方向的论文,并且写博客做深入分析,包括从理论数学公式到实践 实际结果: 学习算法GBDT、FM、EE基础算法、主题模型、doc2vec。而且其中三个没有写论文分析。 完成度:50% 读论文 预期结果: 读10篇论文,包括5篇经典和5篇新的研究方向的论文,对与经典论文要求实践其中方法。 实际结果: 读了一篇:Recomm...

快速配置zsh

zsh的快速配置

比较水的 Personal Notes 查看你的系统有几种shell cat /etc/shells 显示 /bin/bash /bin/csh /bin/ksh /bin/sh /bin/tcsh /bin/zsh 安装 oh my zsh git clone git://github.com/robbyrussell/oh-my-zsh.git ~/.oh-my-...