【收藏夹】

5本自然语言处理书单-附pdf:https://blog.csdn.net/xinshucredit/article/details/90516754

几个常用的机器学习训练数据集(最全格式):https://blog.csdn.net/lihuoqingfly/article/details/90604435

机器学习数据集哪里找:最佳数据集来源盘点:https://www.jianshu.com/p/abce3d177e45

Kaggle:

News Category Dataset:https://www.kaggle.com/rmisra/news-category-dataset

Getting Real about Fake News:https://www.kaggle.com/mrisdal/fake-news

新闻联播(Chinese official daily news):https://www.kaggle.com/noxmoon/chinese-official-daily-news-since-2016

         -- 鬼吹灯文本挖掘2:wordcloud 词云展示:https://blog.csdn.net/zhuzuwei/article/details/80766563

 

NEWS SUMMARY:https://www.kaggle.com/sunnysai12345/news-summary

BBC News Summary:https://www.kaggle.com/pariza/bbc-news-summary

 

Github:

互联网新闻情感分析比赛第八名:https://github.com/zhanlaoban/CCF_BDCI_2019_datafountain350

                            对应知乎解说:https://zhuanlan.zhihu.com/p/101554661

                            赛题:https://www.datafountain.cn/competitions/350/datasets

该比赛的baseline:https://github.com/unclegem/Sentiment-analysis

基于LSTM三分类的文本情感分析:https://github.com/Edward1Chou/SentimentAnalysis

利用Python实现酒店评论的中文情感分析:https://github.com/AimeeLee77/senti_analysis

RNN情感分析的应用:将句子转换为表情:https://github.com/rikichou/emojify


numpy包中,a*b是数组乘法,np.dot(a,b)是矩阵乘法

DIRECT-5a-HP-M427 LAserJet


如果是男孩, 那就把他当男孩培养,让他学会竞争、冲突、角逐、比赛、对抗。

如果是女孩,那就把她当女孩培养,让她学会温柔、包容、格调、教养、才艺。


 国外有类似小木虫的论坛么?

看到楼主的问题,自己也挺感兴趣的, 就百度稍微找了一下,找到了三个网站,据说与楼主要求比较接近。分别是researchgate(一个专业的科研交流的社交网络) mitbbs (北美的论坛)sciencemadness(这个是百度到的,没怎么细查)

mitbbs 是一个不错的论坛 


感觉高兴的时刻:   健身 + 水果捞、芋头牛奶;睡一下午 + 牛肉汤加个饼

感觉不错的衣服:衬衫裙;fake两件套;西装领马甲


静,才能享受当下

外部动力驱动与对话预期落空

《斯坦福高效睡眠法》《高效休息法》


读研秘技:你能更优秀(一):时商,从爱多士说起

http://blog.sciencenet.cn/home.php?mod=space&uid=3389532&do=blog&id=1199529

《我的大脑敞开了》

值得指出的是,跑步配速不快的话,其实也能做到边跑边想研究思路和方案。有的时候,跑步中分泌出的多巴胺说不定还能帮助快速找到问题的突破口。


画好图之后,菜单栏—Edit---Copy page (编辑—复制页面),之后到word直接粘贴即可。Word里的图直接双击,可以直接打开origin,重新编辑和修改图。修改好之后,菜单栏--文件—更新***.doc,即可同步到word。此时出现的文件是可以用Origin打开的,如果不想别人打开,将Word中的图片Ctrl+C,再Ctrl+V就可以了。双击图片,看看图片大小效果吧,ps. 1 inch = 2.54 centimeter。用origin做完图后,怎么导出放在word中呢,用cope page 还是export page啊,论文中都是用什么形式的呢?cope page,粘到word中双击还可以修改。论文写作中使用tiff格式比较多,如果图表已经完成,可以直接输出为tiff格式的图片,再插入到文档中。export比较好,可以输出多种格式的图片:bmp,jpg, eps,pdf等等,几乎什么格式都有了。当然,你如果想在word里还对图进行修改,copy是最好了,这样在word里面双击就可以修改图了。正式刊发的论文大多偏爱eps的,清晰而又不大。投文章的话,大多数期刊都要求用TIFF格式的,copy page肯定不行,还是用export好一些,导出时,图片格式和分辨率都是可选的,而且用图片格式安全一些,不会在不知情的情况下被改动,用copy page的话,只要是word文档,任何人都是可以改动图中数据的。wiley的期刊一般要求转成TIFF格式, 在origin里面导出成TIFF格式, 好像选择LZW压缩方式, 否则文件会非常大.

https://jingyan.baidu.com/article/380abd0a5630271d91192c6e.html 


窦唯,香港红磡体育馆演唱会:https://www.bilibili.com/video/av57224029?fromvsogou=1&bsource=sogou


当面不能说的话,背后也不要说。

反过来,当面能说的,背后能说吗?

一对一地说,因为群说,影响不好。


降维打击的效果,比同行竞争更可怕,因为,那种场景是,我不是针对你,而是将你的整个世界拍平」

所谓靠谱,就是凡事有交代,件件有着落、事事有回音。


外国人翻唱好听的歌:五星红旗、知否、海阔天空、讲真的

讲真的:https://v.qq.com/x/page/k0852q30ax1.html

五星红旗:https://v.qq.com/x/page/k085074htdz.html

https://jingyan.baidu.com/showlist/detail/fec4bce20b7d49f2618d8bfe

《休问》:https://www.bilibili.com/video/av51192799/


2019/9/24 19:06

实验室来了个人,说话声音很轻很慢。

一开始以为是老师,直到看到ta穿的经典的白衬衣,意识到可能是推销员。

在说话的时候,他蹲得很低,以仰视的角度对话。我竖起耳朵仔细听,师妹交代自己是“实习生”。瞬间产生错觉,以为是纪委或者学院老师。

轮到我座位,ta刚一开口,“原型毕露“。果然是广发信用卡推销员。

我回复说“不需要”,扭头看电脑,自认为还是决绝的。只听到他笑了。然后听见他说:为什么用这个木板垫脚?

这个发问出乎意料。我竟然无法拒绝回答,但是也不知怎么搭话。

ta自己接上话来说:“很养生是把。你看我们的卡也很养生。”

说着掏出广告纸,上面有餐厅七五折的广告,还有一些其他福利。ta又问“节日回不回家”之类。

我想尽快结束对话,于是开门见山地说:你观察很仔细,表达也没问题。但是我们真的没这个需求。蚂蚁花呗可覆盖一切开销,而且无风险、方便。以前办过信用卡,注销很麻烦,不清楚流程还多花了50。这么多推销员,和你说话算最多。不是你不尽力,是真的无需求。

ta站起来看似准备离开得样子,顺便递了张名片,同时候还在解释那50可能是”年费“。

我说,“好,你的名片我收了,有需要找你。”

对话结束。这是我见到第一个合格的推销员,有《羊皮卷》、《世界上最伟大推销员》里的推销员的风采。

总结起来:

(1)姿态低、语,和一个人对话时候不打扰其他人;

(2)观察仔细,从对方切身出发发问一些看似不相关的问题。如果ta站得高高得,也不会注意我脚下的特殊之处

(3)留好印象和回头客。短时内把需求、内容全数抛出,临走还递上名片,以这个印象分,人们如果真的有需求是很乐于和ta打第二次交道的。


2019.10.7 

张麻子:师爷,你给我翻译翻译,什么叫惊喜。

师爷:惊喜就是二十年后,给你遇上真正的好老师,接上你的腿。


2019.11.14

一箱粽子换来了一袋子苹果,还逛了一顿饭吃。

见了他们一大家子人,阿姨很热情、小孩很开朗、队友很热情、叔叔很搞笑(出门买童书回不来了)。

他们一家人都对我很热情,特别阿姨一个劲儿夸我。

我们聊了聊未来打算,多了一些信息和规划。


2019.11.15

如果能早点回去,就能早点睡觉。

如果早点睡觉,就能早点起来。

如果早点起来,就不用被人叫着挪车,而且能早早到学校。

如果能早早到学校,就能占到熟悉的车位。

如果能占到熟悉的车位,就能不把车蹭掉皮,就能节省开支和修车时间。


2019.12.24

黎明时分,做了个梦

一个影院类型的屋子里,都是熟人。我一边琢磨论文的逻辑,一遍和另外两人讨论,看能否帮忙和合作完成。

讲了半天,啥也没理清。感觉还是要自己下场亲自干。Too many ideas, but only two hands.

眨眼到了一个楼上,大A鼓励楼上蹦极,我害怕,坐在边缘往下望,不敢动。大A面无表情地路过。

正说着,B从对面楼飞身而下,稳稳当当站在水里,一点都没受伤,一群人于是转战对面楼。

到了楼梯处,眼看着前面的人都爬上去蹦下去顺利过关。轮到我最后一个爬上去时,在楼梯顶上遇到了小A,被绊了一跤。

小A拦住我说:别上去,安全第一。

可是大家都过关了,并且都已经在下面展览台一样的地方并排坐好了,只剩我俩。

心里着急,看看小A,又觉得该听ta的。最后还是听了话,没有去。



【Linux安装cmake和opencv】

cmake:https://www.cnblogs.com/freeweb/p/5788729.html

tar -xvzf cmake-3.14.3-Linux-x86_64.tar.gz
cd cmake-3.14.3/
./bootstrap     # 运行当前目录下的一个文件,最好chmod +x ./bootstrap
gmake
gmake install

opencv下载:https://github.com/opencv/opencv

opencv安装:

cd opencv-2.4.13/
cmake -D WITH_GTK_2_X=ON -D CMAKE_INSTALL_PREFIX=/usr/local .
make    # make -j4表示开4个线程来进行编译
make install

心理学上有种现象叫心流

心流的概念,最初源自Csikszentmihalyi 于1960年代观察艺术家、棋手、攀岩者及作曲家等,他观察到当这些人在从事他们的工作的时候几乎是全神贯注的投入工作,经常忘记时间以及对周围环境的感知,这些人参与他们的个别活动都是出于共同的乐趣,这些乐趣是来自于活动的过程,而且外在的报酬是极小或不存在的,这种由全神贯注所产生的心流体验,Csikszentmihalyi 认为是一种最佳的体验。


厨房心愿单:

(1)绿豆凉糕

(2)湖北卤菜(猪肉、鸡腿、鸡翅、鸡胗、鸡蛋、豆皮、海带)

(3)芋头烧肉、粉蒸鹅肉、豆角腊肉 —> 给家里做


看一只鱼的传说的文章,对周易五行有兴趣。

【2018.10.17】阅读和写作是迄今为止人类发现的最有营养的冥想方式。

【2018.10.12】音乐:autumn day、yellow leaves。

让我想起看灵魂摆渡的感觉。这种带着淡淡忧伤的曲调似乎深入我心。好想用钢琴把它们弹出来。


mpi4py案例:https://www.cnblogs.com/zhbzz2007/p/5827059.html

美国为何一定要整死俄罗斯:http://bbs.miercn.com/bdnews/201807/1753213.html


【认识现实,就是绘制地图】

通向事实的道路并不平坦,我们出生时,并不是带着地图来到世界的。

为在人生旅途上顺利行进,我们需要绘制地图,为此显然要付出努力。

我们的努力越大,对事实的认识越清楚,地图的准确性就越高。

相当多的人却对认识事实缺乏兴趣。

有的人过了青春期,就放弃了绘制地图。他们原有的地图窄小、模糊、粗略,对世界的认识狭隘而偏激。

大多数人过了中年,就自认为地图完美无缺,世界观没有任何瑕疵,甚至自以为神圣不可侵犯,对于新的信息和资讯,他们也没有多少兴趣,似已疲惫不堪。

只有极少数幸运者能继续努力,他们不停地探索、扩大和更新自己对于世界的认识,直到生命终结。


链接:https://www.zhihu.com/question/20988355/answer/25296836

CSDN讲师:July

这人讲遍了《算法导论》上几乎所有算法。不擅长编程,但是能够深入浅出地讲明白。


所以,你需要的,是把体力上的耗费给克制并维持著,并确保自己有充足的时间和精力,再去寻找一个又一个的“命运破点”,并在此之上撕开一个缺口,得以实现突破。

你的事业也同样不会给你出路,因为那满口仁义道德的老板,只会持续不断的画饼来让你竭尽全力的付出。

可是你又不得不全盘接受,希望你的努力能成为晋升之道的基础,他不会告诉你 人生是需要规划的,这个规划可能听上去是一个非常鸡汤和营销的词,但它确实有用和行之有效。

就好像人的命格一样,在什么时间段做什么事,就是能起到事半功倍之效。

因为一旦告诉你了,你又怎么还会心甘情愿的当牛做马为其俯身干活 并心无旁带?

是的,当你身在底层的时候,你的是压力和阻碍最大的。

你什么都没有,什么都不会得到,就连你自己 也看不起你自己。

没办法,你什么都不是,你就必须竭尽全力的证明你是什么。

这个时候,天下与你为敌,包括你自己。

 

却也正是这个阶段,有那么一部分人开窍了,他们意识到 人是不能把自己太当成“人”来看, 因为一旦这样认定,则你就滋生无数属于自己的“繁思杂念”。

这些繁思杂念都是属于标准的 “无错也无益”的想法,它们不会给你带来直接的杀伤,却会在时间的蹉跎中,把你的精力和年华给耗费。

最有代表性的,就是 那些要命的“日常”,恕灏泽直言, 当你自己能够拥有5000万身家后,或者月入50万后,你会发现,那些本来困扰你的一切日常,都成为了无足轻重的小事。

而你真正会投入精力的,实际上仅仅是你的事业和前途本身。

 

于是,你开始学会了超脱,当然 超脱这个词可能用的不是很贴切,因为你的境界还远未达到这个高度,更准确的形容是你开始把自己当成一份资产 一家企业 甚至一个工具。

你更多的开始考虑,应该怎么去“运用”自己,以及如何让自己更好的“改进”,乃至最终“适应”一个又一个艰难险阻。

是的,灏泽看过许多许多人的命格,你要谨记今天我给你奉劝的一句话:

一个人的启蒙和顿悟,一定是把“自我”逐渐剥离的一个过程。

甚至于可以说,人的一生若想有非凡的成就,本就是要把自己的凡心俗念给摒弃,并寻找到一个更周全更宏大的存在意义。

这一切看似很玄乎,其实非也,就如同你所能见到的任何企业家和大成者,往往其事业就是他的生命本身, 两者之间是互相绑定互相成全的。

也因此,你必须找到一个自己的念想,并开始为之决意付出,于是在这样的基础上,我们常言的一切“良习”你都会逐渐拥有。

我们总是常言命与运,实际上 并非每个人都知道自己的命之所在,更妄论那些要在踏上命途后才能知晓的运程。


柳文扬作品集:http://www.kanunu8.com/files/writer/6562.html

怎样写英文审稿意见:http://blog.sciencenet.cn/blog-692836-928133.html

审一篇SCI稿件,整个人都不好了(续):http://blog.sciencenet.cn/blog-827932-928107.html


Anaconda+Keras

Kerqas中文教程:http://keras-cn.readthedocs.io/en/latest/getting_started/keras_windows/


【基础】常用的机器学习&数据挖掘知识点

常见面试之机器学习算法思想简单梳理

统计学习的核心步骤:模型、策略、算法,应当对logistic、SVM、决策树、KNN及各种聚类方法有深刻的理解。能够随手写出这些算法的核心递归步的伪代码以及他们优化的函数表达式和对偶问题形式。 统计学习方法概论:模型、策略、方法是什么几张图说清楚机器学习

算法方面:应当深刻理解常用的优化方法:梯度下降、牛顿法、各种随机搜索算法(基因、蚁群等等),要知道梯度下降是用平面来逼近局部,牛顿法是用曲面逼近局部等等。  共轭梯度法

KNN对应的KD树、如何给图结构设计数据结构?k近邻法与kd树


机器学习工程师职位

作者:刘志权

我面试过5-6家互联网公司的数据挖掘和分析、机器学习相关职位的工程师。被问到下面一些问题。

SVM的原理,SVM里面的核

K-means,如何用hadoop实现k-means

naive bayes和logistic regression的区别

LDA的原理和推导

做广告点击率预测,用哪些数据什么算法

推荐系统的算法中最近邻和矩阵分解各自适用场景

用户流失率预测怎么做(游戏公司的数据挖掘都喜欢问这个)

一个游戏的设计过程中该收集什么数据

如何从登陆日志中挖掘尽可能多的信息

牛客经验

http://www.nowcoder.com/discuss/3196?type=0&order=0&pos=12&page=2

数据挖掘、机器学习笔试题


机器学习十大算法核心思想、工作原理、适用情况及优缺点

http://www.xuebuyuan.com/2127455.html

http://www.cnblogs.com/elaron/p/3325937.html

http://blog.sina.com.cn/s/blog_78a4bd490101g2v5.html

http://www.36dsj.com/archives/24060

http://blog.csdn.net/ndjk454164628/article/details/36932907

Caffe(一个非常流行的linux深度学习框架)

《推荐系统实战》、《模式识别与机器学习》、《集体智慧编程》

《算法导论》绝对是本好书。另外就是建议读一读运筹学,因为很多算法问题其实是运筹学讲得更好,推荐图灵数学系列的《运筹学导论》,有两册。数据挖掘初期推荐机械工业出版社的《数据挖掘 概念与技术》。


python、机器学习、数据挖掘

networkx使用笔记(四)之实战篇--数据的获取:含XML、GML等

Booklist:统计学、数据库和机器学习

《利用python进行数据分析》

《深入浅出SQL》

《数据视觉化展示 技巧》

《正则表达式必知必会》

《R语言实战》

利用Python进行Web开发,有很多框架可以使用,如Django、Bottle、Tornado。

(2).数据挖掘工程师需要理解主流机器学习算法的原理和应用。

需要熟悉至少一门编程语言如(Python、C、C++、Java、Delphi等)。

需要理解数据库原理,能够熟练操作至少一种数据库(Mysql、SQL、DB2、Oracle等),能够明白MapReduce的原理操作以及熟练使用Hadoop系列工具更好。

经典图书推荐:《数据挖掘概念与技术》、《机器学习实战》、《人工智能及其应用》、《数据库系统概论》、《算法导论》、《Web数据挖掘》、《 Python标准库》、《thinking in Java》、《Thinking in C++》、《数据结构》等。

互联网数据挖掘工程师一般都会要求高一点。实践上,首先要知道Hadoop,并行数据处理,互联网公司由于成本考虑,以及数据量大,都会优先考虑Hadoop,spark这些开源大数据软件。所以并行数据处理基本来说是属于敲门砖了,最少你要懂这些原理吧,自己搭过运行过。   

其次,编程语言总要会一点,Python是最简单的了,我现在日常工作就是用这个。

另外Linux,shell这些,每天都要打交道,不用很熟,基本操作总要会的。    算法方面,理论是肯定需要的。虽然有很多软件,包可以离线计算,但你也要把离线计算的参数部署到系统上的,原理不懂,怎么知道怎么部署。再高大上一点就是自己写在线的来计算。算法原理,什么lr,决策树,关联,svd这些最简单的,到gbdt,em,lda可以逐步深入。答主也是这样一步一步过来的,以前也是在传统行业。每天没事做就看看公开课,看看别人的博客和论文。

pip install networkx==1.9.1


Origin快速入门

如何用origin绘图软件绘制对数坐标图?

Origin数据图坐标刻度值特殊标注的方法

Origin线性拟合:Analysis → Fitting → Fitting Linear → Open Dialog

origin同一个图中多个线性拟合

origin分段线性拟合

origin延长拟合范围

origin的几个使用技巧:1.怎么求非自然数为底的幂函数:Origin中的自然数的幂函数很容易,用EXP函数就可以了,但是其它幂函数没有,例如:将一列数据转变为以10为底,数列为幂指数,用10^col(A)就可以了。

去掉legend中某个条目的小边框:右键display control,去掉indicate activite dataset。

origin图去除边部空白的方法

Tools->Options->Page->Copy Page Setting->Margin->Tight in Page

如此,copy page粘贴到word中后不用每次修改和裁剪边界。

找到原始数据:双击曲线,进入plot detail,点击下面的worksheet或者workbook,就能得到原始数据的表格了

将多个表格导入origin:

首先,导入数据绝对不是你那种复制粘贴,太麻烦了。
另外,不知道你用的是哪个版本的Origin? 7.0? 7.5? 8.0或更高的版本?
如果你用的是 Origin8.0或更高的版本,那么导入数据,可以点击Origin菜单栏上的 File —— Import —— Multiple ASCII ,在弹出的对话框里找到你要导入的数据文件,按住Ctrl 全选了,点击 Add Files,OK。
在弹出的对话框里,找到 Import Mode,选择 Start New Columns,这样就可以将所有数据以新增列的方式整合到一张表里了

如何调整Origin图像页面边距过大

 如何调整Origin图像页面边距过大 - 1、“Tools”菜单-“Options”选项,或者直接按 ctrl+U 快捷键。

2、在弹出的面板中选择“Page”标签,在“Copy Page settings”下面有个“Margin”,默认是Page。从后面的下拉菜单中选择“Border”,这时可以看到下面的 Clip Border 后面的值可以自定义了。将其设置为0,确定即可。

3、这时Origin会询问是否将刚才的更改作为软件启动时是默认设置,点OK即可。

PS. 投稿时,若提交word文档,系统自动转为PDF格式时,默认边距好像是5,若设为0,则自动生成的PDF中图是不完整的。投稿时的亲身经历!!当时那个头大啊!好不容易才找到原因的

origin双对数坐标系下的线性拟合:双击拟合线,有个地方要勾上——fit options->apparent fit

origin添加新的一列后自动赋值(数列):

col(A)={dBegin:dStep:dEnd}

4. origin多个图合并在一个图中,1)直接复制。2)layer图层工具添加新图层,右键layer content选中相应数据


工具

The VMware Authorization Service is not runnin

CentOS minimal版安装图形界面的步骤

win10如何进入bios win10无法进入bios怎么办

virtualbox 无法启动虚拟机修复

vbox上安装ubuntu

安装ubuntu

解决如何将新建文本文档默认编码设为UTF-8格式

python中yield用法

sublime text 3配置c/c++编译环境


让sublime支持带input()的python程序运行

1.首先安装包管理器,按ctrl+`,打开sublime的console:输入

import urllib2,os; pf='Package Control.sublime-package'; ipp=sublime.installed_packages_path(); os.makedirs(ipp) if not os.path.exists(ipp) else None; urllib2.install_opener(urllib2.build_opener(urllib2.ProxyHandler()));open(os.path.join(ipp,pf),'wb').write(urllib2.urlopen('http://sublime.wbond.net/'+pf.replace(' ','%20')).read()); print('Please restart Sublime Text to finish installation')

2.ctrl+shift+p,调出包管理器:输入install package

3.输入sublimeREPL,点击安装

4.点击tool,找到sublimeREPL,然后选择python

5.在弹出的页面中编写代码,或者执行execfile(filepath)即可


【教程】教你制作属于自己的标签云

Tagxedo 标签云教程


发布了392 篇原创文章 · 获赞 492 · 访问量 241万+
展开阅读全文

没有更多推荐了,返回首页

©️2019 CSDN 皮肤主题: 编程工作室 设计师: CSDN官方博客

分享到微信朋友圈

×

扫一扫,手机浏览