Yougth Blog

大神养成中.....

主题模型系列算法详解

NLP 模型之一---LDA模型

要讲主题模型要从概率论中的频率学派和贝叶斯学派讲起。 频率学派和贝叶斯学派 首先频率学派的思想很简单,我们观测到的结果就是客观世界的样子,就是直接用实验观测到的数据来描述随机事件,如果试验次数足够多,那么我们观测到的数据就能够准确描述随机实验的分布,比如抛硬币实验,2次向上,8次向下,就会认为这枚硬币正面向上的概率是20%。 而贝叶斯学派的观点是,我们观测的到的不是客观世界的样子,我只...

svd算法及其变种

矩阵分解算法运用

SVD算法是在Netflix竞赛中火起来的算法,当时这个算法夺冠了,然后带动起来一股研究浪潮,发展出了svd++,以及timeSvd等。 奇异值分解方法 SVD全称是奇异值分解,它是一种矩阵分解方法,大学线性代数里面也讲过奇异值分解的方法,但是老师当时没有说这东西有什么用,导致当时学的时候觉得很无聊,为什么要分解这东西。 首先我们知道推荐问题纯从行为来解就是一个矩阵填充问题,矩阵的一边...

2019年终总结

总结&规划

不知不觉2019年已经过去了,算上实习步入职场已经四年了,年初也没有写规划,直接总结一下19年。 今年最大的收获应该是年中正好有个机会,走进了偏管理的方向,看待问题的思路开阔了很多,以前觉得技术就是埋头搞技术,技术NB就是王道,不用管其他的。现在来看,技术只是实现目标的一个方法,而且从算法效果来说,效果提升最高的点往往不是用了一个更NB的算法,而是结合产品形式找到了一种有效的方法,算法角度...

2018年终总结

总结&规划

学算法 预期结果: 从经典算法学起,学习10个工作相关方向的论文,并且写博客做深入分析,包括从理论数学公式到实践 实际结果: 学习算法GBDT、FM、EE基础算法、主题模型、doc2vec。而且其中三个没有写论文分析。 完成度:50% 读论文 预期结果: 读10篇论文,包括5篇经典和5篇新的研究方向的论文,对与经典论文要求实践其中方法。 实际结果: 读了一篇:Recomm...

《必然》读书笔记

科技未来发展趋势

这本书全书是在预测未来的趋势,跟书名一样,未来必然会发生的事情,作者通过一些重点词汇总结未来的趋势。 Becoming(形成) 不知道大家有没有看罗胖2019跨年演讲,基本上挺多观点和这本书吻合度很高,形成主要讲的是所有事物都是现在都是在一个形成的过程中,核心观点是不要觉得未来已经没有机会,实际上加入我们从未来来看现在的话,今天是一片处女地,所以现在是绝无仅有的开始时机。 正如罗胖举的...

推荐系统中的EE算法

推荐系统中的基础冷启动算法

人生中有很多选择问题,当每天中午吃饭的时候,需要选择吃饭的餐馆,那么就面临一个选择,是选择熟悉的好吃的餐馆呢,还是冒风险选择一个没有尝试过的餐馆呢。同样的,推荐系统处处也面临着这样的选择,是推荐一个已经熟悉的点击率很高的物品呢,还是选择一个新的物品呢。这些都可以泛化成一个经典问题,多臂老虎机问题,也是一个研究很广的问题,这里介绍一些常用的bandit算法。 Topmpson samplin...

查询sql要点记录

sql(算法)工程师必知必会

查询基础 查询sql使用AS重命名列名时,别名可以使用中文,使用中文时需要用双引号(“)括起来。请注意 不是单引号(‘)。 查询时候可以使用常数,类似 ‘SELECT ‘商品’ AS string, 38 AS number, ‘2009-02-24’ AS date, product_id, product_name FROM Product;’ 在SE...

职场成长的一些思考

《能者是否应该多老》引发的思考

今天看奇葩说辩论,能者是否应该多劳,挺精彩的,作为一个职场人感觉都应该看看,挺有感触的,最打动我的还是薛兆丰教授的观点,这里分享一下他的观点以及我的一些思考。 他提到了三个问题 工作是不是一种机会? 你的努力有没有人能够看到? 你的工作收入是别人给的还是你要回来的? 其实核心思想是,能者应该多劳,因为能者一般会把工作当成是一种机会,可能会因为你的能力强而被领导提拔,可能...

最近读的书

有趣的书籍记录

心理学是什么 《心理学是什么》是一本心理学的入门书,从人们对心理学的误解,心理学的研究方法,心理学的分类。以及心理学历史发展进程讲起,这部分比较有意思,主要是以各个发展阶段的代表人物以及他们的主要思想为线索 心理学发展进程: 精神分析论心理学–>行为主义论心理学–>人本主义论心理学 心理学历史发展阶段主要有: 精神分析-弗洛伊德,自我,本我,超我,本我是无意识的,...

Recommendation bryond Matrix Factorization

矩阵分解的新思路

摘要 在过去的十年中,矩阵分解已经得到了广泛的研究,并已成为最受欢迎的个性化推荐技术之一。然而,基于矩阵分解的推荐模型中采用的点积不满足不等性,这可能会限制它们的表达性并导致次优解。为了克服这个问题,我们提出了一种称为度量分解的新型推荐技术。我们假设用户和物品可以放置在低维空间中,并且可以使用满足不等式属性的欧几里德距离来测量它们的明确相似度。为了证明其有效性,我们进一步设计了两种度量分解...