写给新入大数据专业的同学的壹点点建议

#高考志愿指南针#

这里所说的新入坑,指的是相关专业大一学生。大三大四考生请忽略本文。另外,本文只是一个方向的引导,并不是什么雄氏老方六味壮骨茶,并不能药到病除,因为这不是药,只是一个思路和策略。它需要你去实践践行,而只有践行,才能看到最后的收益。而这本身就是一件费力不讨好,而且在很长时间内看不到效果,即使有效果,也不是直接的,也是间接的一件漫长的事情。

以下是正文。

本文旨在指导没有经验的想从事此行业的人及刚进入此专业的大一学生,帮助他们在界定研究问题、搜集信息、分析信息以及准备报告时能从繁琐的程序和步骤中找到清晰的思路,并清醒且较为全面的认知到大数据的方方面面,从整体上建立起一个最基本、最基础的轮廓和框架。

关于大数据研究中所涉及到的其他各专业的专业的相关知识所涉及到的各学科的研究方法已有大量书籍出版。本文旨在介绍大数据研究中可能及大概率会出现的具有代表性的行业问题。由于文中内容并非针对或适合所有读者,建议读者有选择性地阅读。虽然各类研究的流程都较为圃定且相似,但读者应尽量结合实际工作来学习或了解这些基础性的内容。本文的目的不是帮助读者成专业的“方法论学者”,而是使读者了解最基础性的内容。

本文介绍了几种进入门槛很低但精通难度非常大的方法或者说入门到精通这个过程中必须经历的若干技能和若干大数据研究中的应用案例,但由于许多内容需要大量篇幅才能介绍清楚,本文没有办法做更为详尽的介绍……本书没有涵盖所有大数据分析和研究方法,因为有些方法的专业性很强,难以在有限的篇幅里详细介绍。如要掌握照片与图像判读和信号分析方法,需要数月的学习;要掌握网络安全技术,则需要强大且稳定的计算机基础知识;要进行人物画像,必须了解和学习甚至完整的掌握生物学、生理学、行为学、解剖学。

大数据及其研究的终极目的

大数据实质上是经过评估的信息,目的是帮助决策者和计划者做出正确的决定。在很大程度上,经过研究得到的结论讲义用于制订(于国家而言,是国家和国际层面的;与公司而言,则是眼前和将来的发展方向与规划)战略计划,通常是长期性的行动。战略计划涉及各类行动,它既可针对现存的问题,也可针对预期问题或假设的问题和情况,后者被称作应急计划。

与制订其他计划一样,制订战略计划需要依据信息。不同的是,制订战列规划所需的信息常常无法获得。因为所有人都会想尽办法隐藏、限制或歪曲对方想要获得的各类信息和资料。所以,战略计划制订者不仅要像大多数计划制订者那样搜集和利用信息,还要想方设法获得对方有意隐藏的信息。这种有意隐藏信息的行为使得大数据研究机构有存在的必要。

因为一旦什么信息都是公开且透明的话,就不需要大数据研究机构的存在了,此外,这种隐藏信息的行为决定了大数研究机构的工作性质。例如,大数据研究机构必须使用各种方法和工具(包括精密的传感器和观察人员)来搜集信息,而且要花大量时间和精力来评估信息质量。因为只有保证原始信息可靠,才能做出正确的评估或预测——此类机构的主要任务之一就是确保信息可靠。

再者,这种隐藏信息的行为也决定了机构需要在无法获得事实时进行推断。针对大多数大数据信息分析或研究项目,机构都会提出系统、可信的推断,然后验证推断,并逐步用可靠的推断(理想的情况是事实)来替代不切实际的推断和猜测。正是这一点使情报研究区分于其他信息搜集活动,这一点是大数据研究的基本要义。

大数据的辩证逻辑本质

对自身的行为动作、操作性工作下的对除自己之外自身所处的环境中的所有人、事、物的观察,并在这个期间寻找存在于事、物、人表象之下的在多次、反复、往返测试和验证下常态化、高频率、大概率、稳定(必定会出现)出现的某种不受人为干预、影响不因人为意志的喜好厌恶而改变,也没有所谓对错和好坏、是非之分自然存在、出现、客观发生及进行的某一现象。

大数据解析这份工作或这件事类似于微积分方程

具体情况如下:

写给新入大数据专业的同学的壹点点建议

不思技艺几成熟,却虑金银载几车。

仰望长天仕是事,更恨食侍令人忧。

忽遇风卷残云势,含恨落泪吞辞令。

望眼欲穿空洞脑,双手空空无记忆。

白纸打试样

笔修定成向

蜡泥铸造身

秘卤煮水成

喷砂烤烘漆

3d硬金成

诩比真金精

吾辈皆英杰

无能受外压

事食难辨识

精神百般熬

不责己乏力

确谴待不公

司值欺我甚

分遣脏累差

勿责不尽力

吾非不出功

不为摸鱼混

事理太复杂

实属压力大

吾乃金嘤佛

怎可受此辱

意欲坐莲台

香延火续绵

天上人间美

笑逐尽开颜

掷金万两有所期

挥笔刷题终究犀

不取深研造技艺

冥求福身裹圣衣(袍服)

这是一条注定会不简单的路,不要指望一键9999999,也不要指望一键一劳永逸。

以上内容是作为一个尚未步入学校还未成为大数据相关专业的学生的你,应该要知道的几件非常基础性的事情。下文的内容,则是对于一个已经是此专业的你,应该要了解的内容。特此说明。

一些最基础性的建议或意见

首先,不管你当前的专业,你自己感觉是显得有多么冷,多么坑,都不要抱怨,请按照学校的课程设计还有老师的要求来。部不论学校的课程设计和安排在你的认知理解范围内,感觉有多么扭曲。请,或者说,强烈建议,认真对待学校安排的还有你的授课老师,绝对不可以消极面对。

然后,试着开始重视下面几件事。

1.试着使用a4纸,写出字行成直线的文字或文章,而不是在没有了格子以后,字与字,就成了一条斜线。

2.试着将你写字的速度和打字的速度,尽可能提升起来。尽可能的无限接近打字每分钟88字(一来是图个吉利,八八等于发发,二来是这种打字速度是非常快的了。当然,前提是,别出错)。

3.试着将你阅读文字(包括纸质图书和电子图书)的速度提起来,后面你就会知道,如果做不到,你会有多么痛苦。标准么?一本小说,大博弈,周梅森老师写的,这本小说,电子版,一天,或者半天就能读完(当然不是24小时,实际只需要5-8小时就能读完,并且读书笔记、重点段落就能顺手提出来)。以这个标准作为你的阅读速度的最低或者入门标准。如果发现很困难,试着克服,试着做到。虽然这事非常难,也在你作为大一新生看来,几乎没啥意义,但介于是大数据相关专业的你,这事和你的精神健康、身体健康、心理健康息息相关。如若不然,真的,后面有好果汁等着你,这些原味果珍,会让你痛不欲生的。与其这样,不如在大一、大二相对闲暇之际,将这块的顽疾克服掉。

在做完或者在训练自己做好上面这几项以后,请努力试着抽出时间,完成下面图书的阅读。这些图书虽然不是什么神书,也不是什么畅销书,但请相信也请试着耐心的将它们读完。这些图书可以购买纸版,也可以找到电子版。这些书基本都有电子版,是可以买到的。

情报研究方法论

写给新入大数据专业的同学的壹点点建议

这本书,其他的书你可以不读,但是这本请无论如何都要将它读完。某种意义上来说,这本书的地位相当于圈子内的马哲。

还有一件事,本书的作者,是圈子内绝对有重要级影响力的老爷子。如果你是想从事大数据行业,就不可能、也没有理由不知道这位作者。如果你连这位作者的书都觉得不足以成为你的书柜上的干货,卧槽,那就没有什么东西可以称之为干货了。

情报与反情报丛书18册

1.《战略情报:为美国世界政策服务》

2.《无声的战争》

3.《情报分析:以目标为中心的方法》

4.《情报:从秘密到政策》

5.《情报分析心理学》

6.《情报搜集技术》

7.《战略情报的批判性思维》

8.《情报研究与入门分析》

9.《情报分析:结构化分析方法》

10.《情报分析案例:结构化分析方法的应用》

11.《情报分析案列·实操版:结构化分析方法的应用》

12.《分析情报:国家安全从业者视角》

13.《战略情报:情报人员、管理者和用户手册》

14.《情报分析:复杂环境下的思维方式》

15.《情报搜集的五大科目》

16.《情报搜集:技术、方法与思维》

17.《情报欺骗:反欺骗与反情报》

18.《以目标为中心的网络建模:复杂情报分析案例研究》

国家安全与情报丛书6册

1.《战略欺骗》

2.《中国古代情报史》

3.《中西情报思想史》

4.《情报分析案例选》

5.《情报分析方法论》

6.《孙子兵法情报思想研究》

国家安全战略研究丛书5册

1.《危中求安》

2.《反恐原理》

3.《锁定真相》

4.《国美国家安全局报告》

5.《美国国家安全局事件》

国家安全译丛10册

1.《情报术》

2.《骗中骗》

3.《全民监控》

4.《谁来监管泄密者?》

5.《数据与监控:信息安全的隐形之战》

6.《21世纪犯罪情报:公共安全从业者指南》

7.《秘密情报与公共政策:保密、民主和政策》

8.《网络战:信息空间攻防历史、案例与未来》

9.《恐怖主义如何终结:恐怖活动的衰退与消亡》

10.《国家安全与情报政策研究:美国安全体系的起源、思维和架构》

国家安全与情报丛书、情报与反情报丛书、国家安全译丛,它们分别各自是一套,且每一套实体书买起来并不便宜,但在G胖那少花点钱,也就都能提回家了。有钱买使命召唤和战地,又或者动不动年卡魔兽世界,或者EVE,还预购一些3A,怎么可能没钱买这书?

 

大学生竞争情报意识与技能培养

写给新入大数据专业的同学的壹点点建议

这是一本不论是否为本专业的学生都可以看的那种纯纯的妥妥的入门级图书,你姑且可以看成是科普图书。

除了上面这些必看的书以外,还有一些简单的入门的课程。这些课程分为免费和收费。

免费的课程清单如下:

2022 春 文献管理与信息分析 直播班链接 – 知乎 https://zhuanlan.zhihu.com/p/473177842?utm_id=0

这是一个简单的不能再简单了的基础课程。闲暇之余,可以补补。它不要钱。

【【乔治华盛顿大学】情报与战略-中英字幕可自选-哔哩哔哩】 https://b23.tv/Do7RYY8

【【北达科他大学】情报分析技能-中英字幕可自选-哔哩哔哩】 https://b23.tv/4PyYXtD

【Farmsec 农夫安全第六季公开课——情报分析-哔哩哔哩】https://b23.tv/99UQLt6

 收费的课程清单如下:

江无情:福尔摩斯的推理笔记

https://www.bilibili.com/cheese/play/ss376?csource=common_hp_favorite_null&spm_id_from=333.999.0.0

重视数学

数学的思维逻辑

写给新入大数据专业的同学的壹点点建议

大数据的数学逻辑

实物——抽象——代数

实物,指可触及可见的事物,也就是大数据的研究对象,又叫数据样本或数据源;抽象,指抽象化的使用语言文字字符符号指代和代替的数字(这些玩意将会被规划到所谓的数据模型中去,特别是纯商业数据模型,特别是纯商业数据模型);代数,指更为模糊和抽象的用于指代数字的代数符号。

大数据(收集和解析)的流程是,从无意识到有意识(无意中发现到开始重视和在意),从杂乱到逻辑(偶然事件到低概率发生事件再到高概率发生事件),从抽象的泛泛而谈到准确性概率的测量确定及规范化、标准化、流程化的建立(从高概率发生到稳定出现和发生直至成为一种常态)。

大数据的数学陷阱

大数据到了最后特别是具体的商业大数据的应用,都会被简化为纯数字字符符号,这样能简化大数据作业的工作量也能在一定程度内提升工作效率。但也会增加出问题显Bug的概率。

因为商业大数据的实践应用,图穷见匕的说,就是为了做更精准的商业广告,卖更多的产品和服务,这是它唯一的目的。说简单一点,就是卖东西。从物理实物到用于精神、精神、心理活动满足与快感的服务,而促使用户花钱购买这些内容的原因或者说动机/驱使,则是商业大数据的研究核芯内容。

营销和策划组全指望着这养家糊口,而各公司招募的大数据从业人员,则会将他们认为的导致并产生用户消费行为的动机及一切消费成因、消费习性,以第一认知的角度去进行摸排确定并将它们觉得正确的内容(成因)捏成一个动态数据模型。这些数据模型就行业内鼓吹的用户分析模型,这种模型的建立过程,又称为大数据精准化商业建模。

而这些商业模式,其实质就是微积分方程(关于这个后面有详细的简单介绍)。但是,由于能影响到用户行为的因素太多了,为了简化模型的复杂程度以满足微操大师、常凯申附体并合为一体的生理、心理需求,便有了将他们任务不重要但确是非常重要的内容的移除和不考虑或减轻权重的简化版的数据模型及换了皮肤的其他类似模型。但是,由于这些内容是凭借它们认知给造出来的,所以注定是会有模型缺陷甚至根本就是一个错误,而这些错误因为一些原因,暂时性的是看不到的,待到环境发生改变,诱发了这个隐藏的Bug带来的错误,一切都将无法挽回。

当看到严重的Bug之后,想挽救,基本是不可能的了。因为很多事情甚至一个庞大的项目体(涉及几百人或者更多的项目)都是就这个错误的Bug构成的数据模型建立的。这个时候,只有两条路,要么,修Bug(一般是拼死挽回,各种改革什么的),在原来的shi山上继续前进;要么,直接放弃,全部推倒重来,重新来一个新的。

虽然如此,但这一个新的模型,还是沿用的所谓的专业的思想和思路建立的,依旧是没有从本质上意识和发现到问题的严重性错误所在(因为相对的偏见和狭隘加浅薄的认知区域,导致其认为自己永远或者大概率是对的,不允许被质疑的、这就是所谓的专业人士的专业水平。但实际上是错得离谱),所以,这新模型,她就是一个Bug2.0、3.0。到了时候,她改出问题还是得出问题,是一件理所当然的事情。而每每到了这种时候,就会把出问题的锅丢给市场环境问题——什么市场寒冬啊,什么消费结构和消费需求改变啊,什么市场竞争太激烈啊,而并没有回到自己本身的问题上来——那个根深蒂固、顽劣且坚定的认为自己是对的、永远无法消除的错误认知。不过,另一方面,当这种事情出现的时候,也基本表示了另外一件事,那就是喜闻乐见的裁员,或者减薪——并自圆其说的美其名曰为战略调整、壮士 、断臂求生。

口可口可。

这里所说的认知,指的是:基于对于用户行为特征、用户需求动机构成进行( )商·业( )大数据分析后,组建的以某种模型(这些类模型往往会智慧的简化很多要素并忽视其存在,因为不好做数模,变量太多了,完全不可控,不符合所谓的模式建造逻辑和必须的规矩,更重要的是领导也不喜欢。而这些内容,才是最重要的,是最终影响这个项目的规划和发展方向甚至是寿命的关键性和决定性因素)为主导和指导思想、精神的商业新项目的创立、开发、产品的开发、市场策划规划、战略布局或战略规划、市场营销。

因为错的离谱,所以发病以至于裁员散货,天经地义。  不除,天必咩之。

如何才能摆脱这种错误陷阱?

无解。唯一的解法就是,尽可能的掌握更多的各门类专业知识。

 

要不要关注或者加入大数据研究或讨论的星球、公众号?

完全没有这个必要,纯粹是浪费时间和精力。所有这些,最后都变成了标准的模板和公式化,而这些都是基于一些最基本的理论而不断的换皮的产物。一个天大的笑话是,那些卖课和上课的,甚至无法说出情报、竞争情报、开源情报、大数据、人工智能、(工业)物联网、互联网、元宇宙的区别和演化发展历史。即使有,也基本都是含糊不清,保证你上头:大概率是译制片文学的水平。而因为搞不清,所以,很多事情搞不定。连电子管都说不清楚,满脑子就想着二极管、三极管——二极管、三极管都不能甚解,开口闭口集成块——集成块都没研究清楚,动不动就集成电路——集成电路一知半解,就敢上单片机编程。

而所谓情报研究或具体应用,实际有些策略和思想方法,你可以惊喜的在考古学的相关著作、论文、教材、图书中找到,并且会非常好用,可以说是拿来就用。

除非你也不想缕清自己的思绪和逻辑,上来就要搜刮被冠名为干货的模板,并且将这视为唯一,并在各类干货模板上左右反复横跳,从此再无它。

有没有必要阅读一些被冠以干货的文章或者花钱学习被吹的上了天的课程?

可以,在确保自己能跟得上学校的正常进度、能逐步完成前面所说的三项技艺这一前提下,轻微涉足,是可以的。

因为是文章,体量不会太大,在能保证高速阅读的前提下,所以它们的阅读并不会占用太多时间。如果没有快速阅读这一技艺,建议少看少读,因为那是无底洞。

如果是花钱不多的微课程,是可以初经人事的试试,但别太当回事,一切以学校为主。

关于这些课程,无法评价,因为这里没有相关经历,无法做出评价。但介于都是从本科生教材扣出来然后套上皮肤这一基本原型来说,其作用非常有限。并且,如果将此类物视为经典,那么,大数据之路作为职业,这路会变得越来越窄,路也很难说走的长。

写给新入大数据专业的同学的壹点点建议

有没有必要做rrs推算和订阅?

可以,因为这本身就是大数据的一个很小的分支。虽然个人并没有相关的经验和实操经历,但有一点可以肯定,这rrs需要当事人了解软件基本运行规则,即编程。其次,需要给订阅的内容上标签,写规则。这就是时下被扯的上了天都半成神了的算法的最基本逻辑。在这个意义上,当事人或多或少可以亲身体历到,当算法中的某些规则变了,包括取样对象和过滤规则,你拿到的结果就完全不一样了。而用户想看到的,和用户实际最后看到的,是不是一回事,就取决于算法了。由此就又不得不扯到另外一件事,那就是模糊算法。因为一旦太精准了,觉得自己很高贵的用户会发现自己的隐私被窥窃了。所以,只能给出用户一个很大的范围,不然就会有天大的麻烦。

说来也怪——如果是一个人,通过观察某人的朋友圈、各类社交平台的动态来还原该人的性格、信仰、兴趣、爱好,那就是变泰,就是恶棍,就是心理不健康,就要拉黑,而如果是其所在的平台,根据这些来推送广告,甚至推销电话那就是理所当然的。这算不算怪哉言论和荒谬的思路?你敢让这样的用户担当某个重要的决策岗位吗?敢,有什么不敢的,专业对口……好,很好,非常好,特别特别好!

 

请务必学会逐步抛弃干货这个概念

大概起,这话说出来会让大一学生感觉到很困惑。不看干货看什么?

首先,这干货是他人认为的,不是你认为的,每个人的学识储备、经历、眼界决定了其认定为干货的基本要求和标准是不一样的。如果拿别人的标准来和自己套用,这……小马过河,柯基游泳的故事,这个可有所耳闻?

小马过河就不讲了。对于柯基来说,水不要太深就可以让自己的身体完全浸泡于水里,就可以游泳。但对于德牧等大型犬来说,这水哪里能游泳?只是刚好把爪爪打湿而已。

第二,干货这东西,很容易沦陷为标准的模板,拿来就用,套不上就是乐色就应该丢掉,就应该被抛弃,这非常容易导致用者的一种依赖和依附思想,丧失自我的主观能动性,变成一个木头。这应该不是什么好事吧?功德加一,还是给别人,这岂不是非常亏,更有种被侮辱的感觉不是。除非你就想这样混日子,那么就另说了。

第三,干货,因为容易引发网络流量,所以,保不齐会被塞进一些其他没用的引流的废话。如此一来,硬是被水泡了,这么一来,它也不被资格叫做干货了。这样,无底线追随的意义也不大了。

第四,就算是被禁止传播的色情小说和无聊的网络小说,一样能扒拉出有用的干货。只是这种内容所占的比例在全文来说,不算太大。如果用户没有冷雪一般平静的心智,这些内容都将淹没在浩瀚的文字海里面。因为其文字内容的特殊性指向,读者怕是很难不被第一主观印象的被带偏,将阅读的注意力放在了那些涩涩的事情和主题上了,冷静的对待文字就几乎不可能了。于是,找到并发现那些抛开涩情主题之外单论某种专业知识的内容的可能性,就无限的趋于零了。而这种状态则是大概率事件,因此,对于普通用户来说,那   和   小说,就自然不是干货了。

举个例子, 国爱情  片的宣传海报,本身也是干货满满。只要你稍微研究下,就能发现包括但不限于构图、用光、服装搭配、色彩搭配、字体字号、字体颜色、字间距、化妆等的实战教学活体案例。

写给新入大数据专业的同学的壹点点建议

你可千万别学成了这样

第五,如果你的头脑非常理智,而不是容易被他人影响和蛊惑,那么,实际上,在你身处的任何地方,眼镜所看耳朵所听身体所触的任何人、事、物,都有干货可以学习。当然,这对于大一的你来说,可能是一件不太容易理解的事情。但真实的情况确实就是这样。处处都有大数据,只是因为你暂时尚不具备或掌握相关的知识,因此无法在你接触到的那一刻,敏锐的意识到它的存在。回到古老的典籍上来,三人行,必有我师焉。说的就是一个意思。

甲 “有介绍信吗?”

乙 有。 

甲 “填个申请书吧!” 

乙 怎么还得填申请书。 

甲 “对了,国有国法,家有家规,店有店章,住我们饭店一律要填,一式三份,用毛笔、钢笔填写,涂改无效。贴上一寸半身免冠照片。” 

乙 好嘛,比领护照还麻烦。 

甲 我接过申请书一看,密密麻麻两大张,得填40多项。 

乙 都填什么? 

甲 姓名、别名、曾用名,性别、籍贯、出生年月,家庭出身、本人成份,来市原因、何人介绍、大约需住几天,是否带有重要公函文件、图纸、绝密 文件,里头写的什么…… 

乙 啊! 

甲 就甭填了。 

乙 我说的呢? 

甲 手提包中是否装有现金支票、贵重的物品,如:金银、首饰、自行车…… 

乙 这自行车能装手提包里吗? 

甲 还有是否携带易燃、易爆、易腐蚀的危险品,如:汽油、火药、硝酸、硫酸、盐酸、香蕉水、桔子汁…… 

乙 桔子汁能算危险品吗? 

甲 还有旅客进店带有几盒火柴、几只打火机,有爆竹没有?几个炮打灯?几把二踢脚,几串麻雷子,几挂鞭,几挂炮,几盒滴滴金儿,几包“耗子屡” ? 

乙 这张是什么表? 

甲 客人安全调查表。 

乙 调查什么内容? 

甲 姓名、别名、曾用名,性别、籍贯、出生年月,家庭出身、本人成份…… 

乙 还是那一套。 

甲 本人面貌、特征,身高、体重、腰肥、身长,穿什么衣服,脸上有无痣,身上有无疤?手指上几个斗几个簸箕? 

乙 这许是通缉在逃犯哪! 

甲 本人何年何月何日来本市?有哪些活动?是突然病故?是由于车祸致死,还是自杀、被暗杀、凶杀?是抹脖子、上吊、投河、跳井、喝敌敌畏?… … 

甲 我一看这是客人健康调查表。 

乙 这填什么内容? 

甲 姓名、别名、曾用名,性别、籍贯、出生年月、家庭出身、本人成份…… 

乙 又填一遍。 

甲 本人身体健康状况:有无疾病,如何治疗的?本人病史、家庭病史、三代 病史,是否得过大脑炎、腥红热、肺病、肝病、胆病、肠病、皮肤病、传染病?有没有高血压、低血糖、重伤寒、血吸虫、肪管炎、白癜风、肾结石、气管炎、牛波癣、羊角疯、半身不遂、产后失调、心肌梗死、骨质增 生?“O”抗是否正常?胆固醇是否偏高?转氨酶是否下降?血色素是否增加?照过X光没有?做过心电图没有?打过预防针没有?种过牛痘没有?住过医院没有?到过火葬场没有? 

乙 没有。 

甲 睡眼好不好,有何习惯?是偏着睡,仰着睡,侧着睡,还是站着睡? 

乙 没练过那功夫。 

甲 打不打呼?撒呓症不撒?说梦话不说?有没有咬牙放屁巴嗒嘴的毛病? 

乙 这跟住店有什么关系呀? 

甲 “有什么关系?我们不管,我们既然分工管这个我们就要调查。快点填!照你这么慢腾腾的,工作效率怎么提高哇?” 

甲 后边要填写家庭经济状况、家庭人口,几个弟兄、几个姐妹、几个小孩、几个爱人? 

乙 什么? 

甲 “对不起!表印错了凑合填吧。” 

乙 不像话! 

甲 父母亲由谁赡养?每月拿多少钱?拿钱时候你爱人爱人愿不愿意? 

乙 管得着吗! 

甲 来店吃多少钱伙食标准?是八毛三的,是一元零四的,是一元二角七的, 是一元五毛九的?是吃劳吃素?是吃米吃面?喜不喜欢包子、饺子、面条、压饹饹?一顿吃几两?喝酒不喝?爱喝白酒、色酒、啤酒、汽酒、曲酒还 是药酒?酒后撒不撒酒疯?是打人,是骂人?是哭、是笑、是说、是闹? 来店准备喝几回?打算闹几次?  

这是相声,多层饭店的台词——这些绕口的内容,其实质就是大数据。你要否认吗?

如果可以,请试着多写点教程

一个完整且详尽的教程,并不容易。首先,步骤要正确,流程要清晰。如果有文字叙述不清、表达不清,那么,势必会有误解、疏漏和歧义、曲解。其次,你会做不代表你会说,你会说不代表你会用书面文字予以清晰的表达。什么是清晰的表达?当你写好后,呈给他人,他人看完,不会产生任何不解、不懂,并且一步一步按照你的文字来操作,期间没有任何意外和bug及错误发生。即使有,你也在文字中给出了方案,照着做,就能顺利解决。第三,在编写的过程中,你会发现,平时言辞华丽、词藻缤纷、妙语连珠的你,居然在使用书面文字的时候,语塞煎难,处处为难。这事(写教程)会让你发现,口头用语和书面用语,完全是两码事。你会惊呼,你都不好用口头用语来书写,特别是如果有平台有征稿奖励奖金的时候,这样文字造诣的文章,十有八九是要被系统落选的。但也无可厚非,如果你浏览了那些被系统选中的文章,你会发现,文字确实读起来很舒服,再看看自己的,没被选上,并不冤枉。

如果你并不介意这件事,那么无话可说。如果你很在意这种事,并且很想时不时的捞一点小钱钱,给自己或者老婆大人(不是真老婆,是半老婆,也就是自己的女朋友)买点小礼物,并且可以很自豪的说,这是自己的稿费换来的(当你说出是用稿费换来的这话后,令夫人的那种发自内心的敬仰和尊敬、崇敬的心情,会溢于言表。你们两人间的亲密度,有概率因为这种无形的技艺的原因,在那个瞬间,骤然提高很多很多),那么这事你就得练笔了。

一开始,怎么方便怎么来,就用你最熟悉的口头用语来写各种文字,主题可以是随意的,总而言之一句话,用你可以书写和表达的笔墨去书写你想记录或你需要表达的意思和内容。实际上,你可以从最简单的打字聊天开始。词汇不够咋办?多看看经典电视剧,然后试着将它们的台词背下来,或者多看看弹幕,觉得不错的就暂停,然后将弹幕抄下来,多抄多写多记多背,然后不断的总结和琢磨,逐渐形成自己的文体。当词汇积累的多了,写的多了,就能写出可以去赚稿费的文章了,至少概率提升了。而所有的这一切,还是和大数据专业的你,未来的生计有密切关系。

无论什么内容的文章,想要获得认可,包括转发、推荐、点击量、系统给予稿费,或者你写的给客户的报告或者企划,又或者你的毕业论文,她们都有一个标准,那就是言辞凿凿,逻辑清晰,没有多余和无用的文字。而这,对于作者来说,就必须要有一个清晰的全盘构架了——要表达什么内容,组成结构,各部分之间的关系,使用的描述性措辞,书面用语的选择,意思和逻辑的表达并连贯,这些都要考虑到。想到哪就说到哪,没有一个相对连贯和清晰的思路,可以,但这个文章大概率没人看,因为几乎看不下去。如果是给客户的文件又或者你的毕业论文的话,那么结果是可想而知的。勿怪你领不到薪水和毕业证,勿怪对面发飙。如果你依旧不在意,那么再退一万步说,就算是聊天或者讲故事,没有这样的一个潜在的基本逻辑,你的听众也会跑光的——除非你学马洗澡,卖挂票。因为确实听不下去啊!(这是一个相声,名字就叫卖挂票)。

做大数据解析,或者撰写大数据解析调研、总结报告,需要严谨且清晰的逻辑思路做为前提。思路混乱或者很模糊,是无法做出令你的客服满意的产品的。勿怪客户发飙,怕是连同事和领导都看不下去。写几个或编程就是大数据?这不是很奇怪的事情吗?

或者再退两万步来说,你作为大一的学生,等熬到大四,总归是要写论文的吧?有些时候,为了一些原因,也是要投稿到各级期刊和杂志的,于是,问题就来了。学生身份的你,想不想尽可能少的被导师打回重写,想不想拒止编辑部的退稿邮件?想不想在你的同学都抓耳的时候,你却相对淡定?再或者,在工作单位面对时不时就要来的各种公文函件的书写要求,你也不想头疼烦躁吧?

 tai  tai,你也不想      吧?

或者再退三万步来说,你想不想在遇到任务的时候,很清晰且快速的就在脑中迅速生成解决方法,然后就可以压着进度按照自己的喜好来故意暂缓或加速进度,并且还可以故意表现出压力很大的一种状态,让你有理由摸鱼划水?因为在接到任务的那一个瞬间,就有了完整规划,因此可以自由应对,轻松支配。

如果想避免这些麻烦事情发生在自己的身上,那就试着开始重视写作这件事。不要觉得很烦,不过,如果真是这样,上述那些麻烦将最终让你自己精神备受折磨。该受得罪,最后还是得受,它是跑不掉。

当你能做到你的投稿五投四中或者三中,剩下几次是因为内容不符合录用选项但文字本身没有什么问题,相信自己,上面的那些问题,基本对你来说不是什么问题了。这里说的投稿,指的是以游研社为代表的,有审核编辑且对稿件内容要求很高的平台的投稿。系统自动审核的,并不能说明文章的好坏高低。

如果可以,请试着做一些图书简介或影视作品简析的视频并尝试投稿

这样做除了练笔之外,还有一个目的,那就是学会概括与归纳总结。点击率高还有粉丝数量多的up主,之所以会有高额点击量和众多粉丝,不是没有原因的。如果将点击量很高的视频用软件扣下来,再用软件将台词扣出来,整理成文档,你会发现,其质量,和准论文没有什么区别。而且,不需要怀疑的事情是,这些视频的文案,百分之百就是按照论文的格式来写的,包括一级标题、二级标题、三级标题,最后还有备注和信用文献出处。只不过这些文案,在视频中是看不到的。

如果你想在大数据从业一事上有所建树,或者不想被人耍猴任人骑,拥有相对独立的主见和判断力意识,那么,对于事物的归纳和总结这一考试不考、文凭不卖的隐形技能,是必须要修炼的。只有这样,你才能在繁杂的事理中快速的捋出头绪。不过你可能会说,这和大数据有啥关系?

同学,关系可大了。

第一,大数据是啥,就是一眼望不到头的数据和文件、资料,既然你从事的是大数据岗位,那么,你每天面对海量,多的要你头皮发麻的事和各类信息,是家常便饭。这是一件非常正常且普通无奇的事情。你必须要面对它们,因为你的岗位就是做这个事的。如果要你从中找到有用的信息,缕清这些东东彼此之间的逻辑和联系,你自问,是不是非常需要缕清繁杂事物的思绪?如果和蚂蚁搬家一样,那就算是24小时加班,也干不完。就算是用辅助程序,你也得写好程序。而这程序,还是要靠你自己来写,思路不清晰,那这程序只能起到debuff的效用,苦的是你自己,而不是别人。没人能帮你。一切痛苦和折磨,还是要自己全部吃下。想靠术士的法术进行转移?这不可能。

第二,大数据相关工作在清理完前期信息后,需要你根据上级的任务要求,捋出下一步的行动清单和流程,第一步至最后一步,每一个阶段的详细要求,要达到什么结果,要取得什么目的,如果推进中出现了意外有什么补救措施,备选方案是什么,而不出意外的话,所有这些是没有任何人告诉你的,都需要你自己去解决,去捋顺,想清楚。如果你做不到,大概率是被叱责的。虽然有老人带新人一说,但不可能保证所有的老人会愿意倾囊相授——这其中既涉及到教会徒弟饿死  ,也涉及到其人的语言表达是否能被你理解和明白。有些人不善言辞,也不擅长教授,只擅长亲自实操。你不能责怪他不愿教你。除此,还涉及到一群混子,毛都不懂,只会口花花,技术?几乎没有,想从他那学到从业技术,概率不大。你说,从繁杂的事理中捋出思路和顺序,是不是很重要?工作场上总会有人说这大那大,这不顺那不顺,但从来不认为是自己没有拎出头绪和秩序而导致的。而一本书或者你的教材又或者一部影视作品,和繁杂的工作任务比起来,是不是简单和单一了许多?既然早晚都要涉足解析事物一事,为什么不在大学事务相对没有那么繁杂的时候尽可能的将这活计学会了掌握了?

第三,就算你不从事大数据信息解析相关工作,其他行业的任意岗位都会存在同样和类似的事务解析工况。不要以为只有大数据岗位才有这种事理,以为只要不涉及就好。然而这想法是错误的。除非你想和那些这大那大的前辈们一样重蹈覆辙,将ta们的痛苦也附魔到自己身上,再来一遍。

如果想走出你对本专业的迷惑,可以试着学习下推理技术

大数据的核心不是使用学校教的软件和课程所涉内容,而是推理。推理这事,考试不考,老师不教,除非你是物证技术专业或者刑事侦查专业。不论你使用什么技术或软件,到了最后,还是需要使用到推理的相关逻辑。一步一步,最后找到既定的结果。痴迷软件编程,没有什么错,但它永远只是一个辅助工具和道具,在使用任何软件或者工具之前,需要确定清晰、准确的步骤和方案,否则,软件使用的再溜,最后问题还是无解。

如何才能推理,如何才能进行推理?这是一个问题,但也不是问题。因为问出这个问题,说明提问者还没有建立起必要且充分的知识储备,并且这些知识彼此之间也做不到很好和有效的联动。这是一种技术储备或知识储备相对贫瘠的状态。而当当事人掌握了数量一定的除计算机软件使用技术及技巧之外的其他任意学科的专业知识以后(至少三门吧,深度就以相对来说简单的不能再简单的本科生教材作为参考基础),这样的问题应该就不会再被发问出来了。如果还有,那就只能说明一件事,学艺不精,没有学透和学懂,基本上就是石锤的伸手党,又称白嫖怪。白嫖怪是很难立足的,至少,很难变得让自己觉得舒服,因为嘛事都觉得难。当然,在某个具体的技术上,也就不要指望能小有成就了,虽然这不是不可能,只是概率太低了。

在不影响正常的刷分考试的前提下,尽可能的涉猎并透彻的掌握其他任意专业的知识,专业不受约束和限制,同时最好是以本科生教材为蓝本

选择本科生教材的原因是,其内容无需再做更多的补充和完善,也基本不存在错误,其所涉内容更是以系统和建制体系的形式出现,省去了查证真伪和正确与否的过程,能节约不少精力。

第二个原因是,如果有不懂的,可以相对轻松的找到教辅图书资料。只要你愿意花钱或者愿意钻研(比如翻帖子),就一定能找到。

之所以要这样,是因为,在未来你可能会投身的大数据岗位上,仅仅掌握一门计算机程序的使用方法(被嘚的上了天好像无所不能的计算机辅助程序,又称大数据分析软件),是根本不够的。可能吗会说,不是有各种微课程吗?

微课程的本质

几乎所有或大多数存在于朋友圈的那些微课程,你都可以找到它的原型,去自学。你务必要知道一件事,那就是,所有的微课程,都是大学本科生教材的私生子。不论它的讲课人是谁,也不论讲课人的身份有多么拉风。它是本科生教材的直系血脉的产物,这一点它永远无法被改变。

它们无一例外或者至少大概率是将本科生教材的内容,东拼西凑再加上一些蛊惑人用于销售的话术,多方内容,拼凑在一起的缝合怪。而这些缝合怪的价格,可比单纯的本科生教材全额的书费,翻了不知道多少倍。如果你没有意识到这样的一个客观事实,只能说你还暂时没有参悟透事物的本质,多少有点遗憾。虽然在这里也必须承认,有不少教材也是一锅煮糊了的稀饭,喂不饱,但即便如此,也还是比以商业吸金冥氪的课程要仁慈和靠谱点。仁慈,指不至于飙到离谱的价格,靠谱,指至少内容的逻辑和框架及严谨程度,经过了教育部教材编审委员会的审核和鉴定,空假套水的内容理论来说,会尽可能的少。

当你能吃透了本科生教材,或至少对某个具体的专业知识有了一个相对体系化、健全的了解之后,就会发现,那些微课程就是在水字数,骗钱。,对于一个妥妥的骗钱的东西——本科生教材的缝合怪,明知道是智商税,你还会去掏钱吗?少花点时间刷朋友圈,少看几部电影,少点旅游,书都看完了好几本了,就是有点费时间,但至少不怎么花钱,也不怎么费鞋子不是?

 

微课程的学习遇到困难看不懂怎么办

你可能会说,看不懂咋办?除了要加强对于书面文字的理解水平之外,你还有一个折中的解决办法。

看,你还能找到伴侣,有什么不好的?

实在不行,你可以去别的专业的同学的课堂去蹭课。甚至,甚至,甚至,运气好的话,还能遇到情投一盒的老婆大人和两情相悦的老公酱酱。这又不是没有可能,而且可能性还非常非常非常大。你看,书中自有颜如玉,书中自有中郎酱。

现在网络如此发达,你想看哪门课,它们的视频课程几乎都能找到。

在不影响正常的考试及学业的前提下,试着默写某本或任意一本教材的大纲内容,争取做到分毫不差

这件事也是几乎费力不讨好的活,但如果你想在大数据从业这件事上有所建树,这事你还真得认真对待。

原因非常简单。

因为,前文已经向大一的你非常客观的介绍了大数据从业以及你即将面对的、以后一定会面对的各类实际场景。这些场景对于大一的你来说,毫无疑问,那就是人间地狱,精神审讯室加精神刑具调教室,痛苦,是大大的。而如果你想以鸵鸟心态去面对,最后,还是无法逃掉该有的折磨。怎么才能尽可能的减轻自己的痛苦,忍受尽可能少的折磨?

试着将一门具体的专业技术彻底的吃透,而这,就要成为日后你吃饭的压箱底的技艺了。它和考试刷分刷题没有任何的逻辑关联。你考试高分,不代表你就将这门课吃透了。因为考试不是全篇高强度高深度或者无一遗漏的全部覆盖,它一定会有侧重点和轻视或无涉及的地方。所谓考试大纲,就是将考试要考的内容所涉、深度、强度都如同脚本一般显现告知给你了。在告知了考生要考什么什么都前提下,只需要有针对性的刷题就行。然而,这真不代表更不意味着你就全部都弄懂了。

如何才能算的上是吃透了呢?只要你能在任何时间、任何地点、任何场景、不借助网络查询、不翻看原图书、不向除你自己之外的任意第三人求助的状态下,将任意一门课本(因为你目前还不可能接触到除课本之外但是其内容却又和课本一样是成体系成建制并且内容经过鉴定和审核是几乎无遗漏和错误的另外一种存在状态和形式的知识或技能了)的内容,使用任何形式,包括但不限于思维导图软件或流程图软件以及最原始的纸和笔或口述,按照或接近原书的框架结构、逻辑,完好无损、无遗漏、无错误的呈现出来。做到这一点,才能算是你真正吃透了。

说人话就是,(相当于)默写或口述原书的目录,如果可以的话,将原书目录下没有的但是在正文内容却存在的三级或者四级标题,也默写或口述出来。用更为简单的措辞来说就是,对于全书所涉的任意内容,信手拈来,如数家珍,滔滔不绝而无一错误、纰漏。

只有这样,才能勉强算的上是基本掌握了一门特定的知识或技艺。因为如果你对相关概念的内容是猫咪玩的毛线球一般的存在的话,你是根本不可能在上述这种环境下将它们无遗漏的叙述出来的,这是不可能的,200%甚至500%不可能。

而一旦当你做到了并且做好了这件考试不考文凭不卖的看起来费力不讨好的事以后,则标志着你开始或者说已经逐步建立起一个初具成型的个人知识储备库了。当你能做到更多数量图书的内容的这般呈现,你将无限接近于Silent Hunter ,啊,不对,Sherlock Holmes。

最使我(按:华生)惊讶不止的是:我无意中发现他(按:福尔摩斯)竟然对于哥白尼学说以及太阳系的构成,也全然不解。当此十九世纪,一个有知识的人居然不知道地球绕着太阳运行的道理,这件怪事简直令我难以理解。

他看到我吃惊的样子,不觉微笑着说:“你似乎感到吃惊吧。即使我懂得这些,我也要尽力把它忘掉。”

“把它忘掉!”

他解释道:“你要知道,我认为人的脑子本来象一间空空的小阁楼,应该有选择地把一些家具装进去。只有傻瓜才会把他碰到的各种各样的破烂杂碎一古脑儿装进去。这样一来,那些对他有用的知识反而被挤了出来;或者,最多不过是和许多其他的东西掺杂在一起。因此,在取用的时候也就感到困难了。所以一个会工作的人,在他选择要把一些东西装进他的那间小阁楼似的头脑中去的时候,他确实是非常仔细小心的。除了工作中有用的工具以外,他什么也不带进去,而这些工具又样样具备,有条有理。如果认为这间小阁楼的墙壁富有弹性,可以任意伸缩,那就错了。请相信我的话,总有一天,当你增加新知识的时候,你就会把以前所熟习的东西忘了。所以最要紧的是,不要让一些无用的知识把有用的挤出去。”

我分辩说:“可是,那是太阳系的问题啊!”

他不耐烦地打断我的话说:“这与我又有什么相干?你说咱们是绕着太阳走的,可是,即使咱们绕着月亮走,这对于我或者对于我的工作又有什么关系呢?”

1.文学知识——无。

2.哲学知识——无。

3.天文学知识——无。

4.政治学知识——浅薄。

5.植物学知识——不全面,但对于莨蓿制剂和鸦片却知之甚详。对毒剂有一般的了解,而对于实用园艺学却一无所知。

6.地质学知识——偏于实用,但也有限。但他一眼就能分辨出不同的土质。他在散步回来后,曾把溅在他的裤子上的泥点给我看,并且能根据泥点的颜色和坚实程度说明是在伦敦什么地方溅上的。

7.化学知识——精深。

8.解剖学知识——准确,但无系统。

9.惊险文学——很广博,他似乎对近一世纪中发生的一切恐怖事件都深知底细。

10.提琴拉得很好。

11.善使棍棒,也精于刀剑拳术。

12.关于英国法律方面,他具有充分实用的知识。

按照S.H的观念,人的知识储备应该像一个仓库。不论是什么知识,都应该以仓管的形式,按门类按种类分级且有条理的存储。如果对于这一点不是很明白的话,非常建议你将带独立缓存的固态硬盘的工作原理并储存机制弄清楚,再来看这段理论,大概就能明白了。只不过,用于储存信息的电子,换成了人的脑细胞,说的再直白一点就是用于存储特定信号的条件反射弧(对于这段文字不明白的你,可以查阅下高中生物,关于记忆的那部分内容),主控则变成了人的思想意识下的思考(事理的)逻辑

因为所有的知识可以做到门类清晰,随用随调,并且关于这些知识的深层次结构和近乎完整的内容大致能做到了如指掌,又因为你已经掌握了数量、种类都比较可观的知识,所以,在当你真正面对所谓的大数据从业岗位的具体的某个大数据分析的任务时,理论来说,不仅没有精神压力,反而还可以在很短时间内拿出解决这个任务的全盘思路、流程、策略、重难点、所涉及的具体学科(这是最重要的。相当于找到了能够归口的方向,即使要找资料,也能很快的定位,在有了一个几乎明确的方向所指后,找资料的方向也更清晰了,为此将能节约大量的时间),这对你来说,无疑是从业优势,至少可以拉开和他人的差距,凸显你的不同。由于你涉猎众多,见到和遇到的也比其他人多,故而,思路也因之更开阔,眼界也比别人看的更远更宽更深,能找到和发现别人无法发现的视野和思路盲区。当然最重要的是,你可以故意装作压力很大,将主动权掌握在自己手里,实际则不紧不慢稳步推进的进行着预定计划。你甚至还可以借此机会摸鱼,借口是,工作压力太大,只能“摆烂”,缓慢推进。

而这些因为建立起清晰的思路、看待事物的逻辑、策略、方法带来的优势以及涉猎众多带来的知识储备,会让你的大数据分析更具有可行性、更接近事理的真相、更容易被客户所接受和认可(前面也已经解释过了,所谓大数据分析,就是做逻辑推理。正确的推理是建立在充足且必要的认知这一基础之上的。它除了需要严格的逻辑推导过程之外,还需要在掌握数量相当的各专业知识的基础上结合实际情况进行分析和判断。而推理的正确性要在实践中不断验证和修正。你不能开口闭口什么智慧算法,什么智能算法,又或者什么什么Ai,都要先跑个ai才能展开。如果是这样,那医院急诊科就别开了,也别去了。因为没有ai跑完,我不能盲目无知粗暴的去下结论,对吧?对吧?……这些,不是说掌握几个所谓算法,又或者考取了什么什么软件资格等级认证,就能获得的。请时刻牢记,它和敲门砖学历没有任何关系。如果你是借壳党,你会发现,如果你思路一片混乱,哪怕你借的壳多么好看,你终究还是会严重精神衰弱。这是谁的问题?)。当这种认可次数多了,你也可能会被同事及上级赞许,有概率晋升,不过这些都是后话了。

掌握一门除计算机编程以外的任意一门专业技术

计算机技术,特别是编程技术,虽然是时下大数据行业,离不开各类所谓的数据分析软件。而这里面就少不了计算编程。于是,各个学校将编程好计算机语言作为此专业的必修和重点科目就成了一件看起来和听起来都很正确的事情。于是开口闭口就是编程、 语言、数据库等言词。

但是:

计算机编程,类似于数学的代数计算公式、几何的定义与原理,如果没有具体的运用对象,她们只能是单调且几乎只能成摆设一般的存在,因为终究无法直观感受到它的实际作用于效果。只有将代数符号、代数公式形成的计算公式的每个字符与具体的单位(计量或衡量单位)相关联、绑定,它的作用才会被人重视和在意,才能起到应有的作用。

计算机编程正是这样的代数运算式。某个大数据软件也是同理:程序软件确实很强,可以在一定程度解放双手,但这软件要做什么怎么做,流程步骤,它并不能全自动。若真能全自动,还要工作人员做啥?你什么时候见过能自动组成微积分方程式的软件?输入指令,给出要求,自动成式?

程序也好,软件也罢,她本质上来说,就是一个计算器。软件、程序的不断发明与创造,其本质是从简单的心算到纸笔划拉打草稿到算盘或算珠到第一代按键计算器到可以进行幂指对运算的计算器到可以运算三角函数和微分和积分的计算器到可以进行多用途换算的计算器,由实物到虚拟化的一个演变。所谓实物,纸笔——算盘——键盘计算器——虚拟化的手机计算器程序和电脑上的计算器程序——各类大数据运算并解析软件。

关键是,这计算器她本身还在不断的进化。可是,人的精力是有限的,想做到100%跟得上,100%同步,是非常困难的。况且,还有一部分人,会因为年龄的原因,面对技术的更新而力不从心(虽然必须说,不止年龄原因而无法同步,就算年龄不大,一样无法做到同步)。失去同步,结束罪恶的一声。刺客信条。

一言概述之,你目前所学,只是如何使用计算器及高级计算器的使用技巧。谁都知道,会用计算器,啥事也坐不了。因为就连初小的同学都会用。难道不是?如果不能将其运用到具体的事情上,是几乎没有什么用的。

如何才能解决这个尴尬?很简单,你得掌握一门具体的技术。或者,一路黑到底,将计算器的使用,发挥到别人不可匹敌不可企及望尘莫及的高度,但大多数人是做不到的。如果你并不认可这个计算器理论或观点,那,可以脑补下下面这个场景:

你是一个英语专业的学生,除了英语,你其他任何专业的相关知识都不懂,并且,还拿到专六的资格证。你欢天喜地,觉得人生美好之路就此开启。然后,现在,你如愿应聘成了一名翻译,但是要你翻译的文件是一份工程机械的专业英语资料,又或者航天航空、航海专业的英语,又或者生物医药和医学的资料,并且以上内容需要你在规定的时间内完成,因为这就是你这个翻译要做的工作。通篇的专业术语和专业内容,让你头皮发麻。试问,你要如何应对?你可不是英语专业的学生,难道这都看不懂做不了吗?

没有半点专业背景,就想凭借使用计算器和   ,来干预和上手相关行业的大数据解析工作,只有心大的人,才敢,才会有这种想法。就算是所谓的团队合作,你真的以为联合作业和协同作业是那么简单的?你可知道,霉菌你联合作战司令部成立了,五大军种之间磨合了多久才有现在这种到处欺负人的水平的?即便是现在,依然还有很多不足。

你的心是有多大,胆子在太阳系之外,让你有了这种想法?

 重视各类信息并尽可能为自己的衣食住行学所用

大数据囊括了公开信息、媒体所吹的开源信息、非公开信息。

公开信息,只要有渠道,就能查到。后者,需要密法才能拿到。

前者的渠道,包括但不限于对外公众开放及发行的新闻、公告、杂志、报告、报道、书刊、报纸、社交平台的动态、网站、文章等。只要有合理的消防梯,就能查到。但查到了不代表就表示你也知道或完全知道了。通过这些查到的信息展开初步的简析,来获得更深一层次的内容,这才是大数据解析。

非公开信息,她算半个公开信息。因为她是对于公开信息的研究解析才能得到的内容:在什么样的历史及世界背景前提、原因下以什么时间什么地点由什么参与人组织并发生了什么事。参与人及各相关方都是什么,因为什么原因选择了事发地,因为什么原因发生了以什么样的起因、经过、结果的事,事的详细细节是什么,这件事的意义、作用、效果、经验、性质、教训、心得是什么,这件事的发生说明了什么、意味着什么、预示着什么、表明了什么。涉及到的人员的详细信息都是什么。

这些都是基于开源和公开信息的解析拿到的。如果思绪混乱,是不可能得到以上这些信息的。

这种简单初级的信息预制,从学科的分类上来说,可以大致归属为刑事侦查学、询问学。至少,沿用了这两门学科的思想和策略。

这不是说用几个所谓干活的模板拿来套用、上几个速成班就能学到和掌握甚至就此就能知道的。

要想做到,要想所见即所得——在看到这些信息的第一瞬间,上述信息就基本已经在头脑中形成,就已经有了大致的结论和初级的判断,没有别的任何办法,只有研习其他专业的知识,并且试着将所研习到的全部内容捏到一起,形成一个庞大的整体(如前文所说的,福尔摩斯的栅格理论)x0。做到看到便想到,想到便知道,知道便明白,这事听起来挺容易的,对吧?但做起来并不容易。它没有任何捷径没有任何速成班。那些所谓的培训课程,速成班,基本做不到这一点,不管它们的宣传广告写的有多么好多么多么神。只有扩大了自身所掌握的相关的学科专业知识的范围,才能有机会做到否则就是迷之自信。

大数据最高境界就是让对方老老实实积极主动心甘情愿的向你交代一切掏心置腹无任何保留

做到这一点,除了理论上通过无差别无死角的各学科知识的掌握来进行开口跪的信息获得之外,剩下的一条路就是通过与其人产生交集交往,赢得并获取对方的认可,令之崇拜有+、崇敬至极、尊敬,使其无所不言,无辞不真,无所不谈,几乎倾囊相诉,成为无话不谈没有任何隐私保留的好友。如此一来,大数据就……

如果可能并且可以的话,因为你的学识令人瞩目,或不可小觑,于是,你将有机会进入到其人的活动圈内。对你而言,你的交际圈的范围变大了,有非常大的概率会遇到其他行业、领域的从业人员,然后依旧使用你出众的学识,来与之交往。在交往的过程中,你的社交圈将再一次扩大,并且,因为人员行业众多,所以,对于各行业、各职业、岗位的大数据信息,将会在闲聊之中轻松获取。

将这些信息进行乐高拼接,就能得到一份很不错的商业大数据了。

如果可以,请在任何时候进行大数据统计与记录

虽然这样做会让人觉得很是无聊,并且这事注定会很伤神,但还是请试着这么去做。

具体的对象——

如乘坐公交:费用、时间、距离、试着归纳自己的行踪的规律特征。

如假期旅游:目的地、出发地、途经地、交通方式、交通时间、交通费用、购票渠道、抵扣卷使用情况、出发时间精确到日时分秒、抵达时间及中转时间精确到日时分秒、同行人员及相关关系、携带物资清单详情、始发站点、途经站点、目的站点、线路规划及备选方案、沿途(人、事、物、建筑、人文、居住环境、费用、当地气象条件和所在时候每日气象情况,包括但不限于气温、风力、风向、干湿度、紫外线辐射程度、当地方言、目的地看点、目标或观看对象的(历史、价格也就是门票、抵达方式走路还是缆车还是其他形式)、出行期间美日三餐详单(价格、品类、制作方式、口感、色调、选择她的原因)、全程总花费、日花费详单、全程总路程(可以用计步器计算)。

这些是个人大数据的一部分,而你供职的单位进行的所谓商业大数据分析,就是由这样的许多个你做为样本而构成。

当你亲身经历、亲笔动手编撰,多来几次,你就知道商业大数据的样本搜集和分析的重点和要义是什么了。这为你日后展开或从事相关的工作,能积累不少一线的实际经验,包括参数设计、流程、步骤、原因解析等。

当然当然,这些还能帮助你追求你自己中意的另一半——这可是看不见的奇招。

 

 搜索并关注以下Up主

他们的视频,几乎都涉及到信息总结回归、信息提取、数据分析,唯一的麻烦就是,你看不到分析和制作视频的过程,只能看到最后的结果,不过这也足够了。如果能研究这些up主的研究问题的思路,你不可能没有涨进。这些Up主,分别是:

写给新入大数据专业的同学的壹点点建议

写给新入大数据专业的同学的壹点点建议

写给新入大数据专业的同学的壹点点建议

写给新入大数据专业的同学的壹点点建议

从他的第一个视频开始,一条一条的看。建议将视频下载下来,然后丢到你的电脑可以跑的视频剪辑软件里面去,将画面展开涉及到算法的那一帧,截图下来。仔细查看,仔细记录。只要将这位up主的视频都按照这种方法来对任意目标对象展开解析,你的大数据实战水平也基本有了质的飞跃。不至于说,处事没有思路,这是不可能的。除非你一路只会喊666,除此之外啥也不做啥也不想

如果真的是这样

而这些内容,是只知道买卖交易相关方所根本不及的或者这么说,卖课的根本不会教给你的。

写给新入大数据专业的同学的壹点点建议

他有好几个视频都是做柯南数据统计的,除此之外还有对主线剧情的逻辑推理。你作为大数据专业的学生,这样的逻辑思绪,是必须要掌握的。这其中包括这位up的算法即如何定义的、统计的流程、最后的大数据报告也就是视频中出现的图表(视频暂停可以拿到)、完整的大数据报告的呈现(就是涉及或者说主题为数据统计和分析的视频的台词即视频文案你可以将视频下载下来以后,用软件导出视频文案,然后当成模板教材,认真的学习。需要友情提醒的是,写大数据报告,也是未来从业中,无法回避的一项工作之一。不论你走到哪,这事都少不了。既然如此,为什么不把这种技艺学到手?为啥?为啥?

敲键盘码代码就是大数据的全部?想多了

 

如果你想让你的思路变的开括和宽广,那么请试着阅读下面这几本书

写给新入大数据专业的同学的壹点点建议

写给新入大数据专业的同学的壹点点建议

写给新入大数据专业的同学的壹点点建议

或者,类似主题的书,也行。至于推荐这类图书的原因,前文已经在 “ 一件殊途同归的事 ” 这篇章做过介绍,这里就不累赘复述了。

关于大数据的一点哲理性简析

对任意一个以任意方式、任意手段接触到的任意对象的所拥有的潜在需要发现与挖掘的或外在直接或者间接接触就可以获得并了解到的所有的可能的或一定会影响到这个对象所当下或者曾经拥有的甚至未来意识存在形态及可能的物理状态的全部可能性因素的提取、整理与分析。这便是大数据行为本质。了解并弄清楚了其实质性本质以后,将会显著提效率和质量。这其实就是大数据实践性本质。

而这项工作就是解数学的多元多次方程。在这个方程的左边是构成这个对象的全部的所有因素,它们按照一定的存在方式、搭配方式、存在状态和方式和存在比例有规律的存在并包含在这个对象之中。而在这个方程的右边,就是情报工作的目标或者预期计划结果。这个方程是可逆的。它既可以从左推导得到右边的结果,也可以从右边推导得到左边的构成因素(详细)。这就好比知道了结果,就一定要去推导得到原因和起因经过,而知道了起因经过就一定要知道结果。

而这就是简单的逻辑推理。在化学方程式推演计算、刑事鉴定、案件侦察、数学公式计算推演、战略/兵棋沙盘模拟推演、预估目标/结果,都是需要进行逻辑推理的。所谓情报分析,其实质原本就是逻辑演算。

当然,这种推理绝对不是随便乱猜,而是要根据一定的并已知的既定事实,结合相关的且已经被认可、承认的知识理论体系,进行恰当、必要、充分与积极的信息反馈。

这便是情报工作的不因人为主观意志的转移而改变的哲学本质,或者,自然状态下的物理事实。

美国情报界的全源情报  all  source intelligence 。它是指情报产品或组织、活动包含所有渠道来源的信息,通常最终形成的情操产品。包括人力情报、图像情报、测量和特征情报、信号情报和公开来源数据。

全源情报这个概念以及它的定义,……………它比较客观、准确的描述了情报工作的范围、单位、手段、技术、方法。

把大数据从业人员看成是噬铁虫,把工作对象、研究目标、既定任务看成是隔板这样的拥有自主意识的独立的机械生命体的话,结果就只有一个:会被噬铁虫拆的连渣渣都不剩。

写给新入大数据专业的同学的壹点点建议

所有的任务、工作对象、研究目标等所有的目标对象所包含的元素会被像噬铁虫分解汽车人那样被拆解和分尸。————所有的目标、任务、对象里面包含的全部元素都会被在第一时间内被情报人员清晰、准确、详细、无一缺少、逻辑缜密的罗列出来。

如果需要,你应该得出以下信息:1. 这些元素是如何被组装到一起的;2. 在这么多元素之中,哪些是重要的核芯部分,哪些是次要的;3. 在这些对象之中又涉及到哪些方面的知识;4. 这些元素(主要是被涉及到的知识中)可能存在的工作原理是什么,有可能出现的问题是什么,可能存在其他的技术要求或者技术门槛是什么。这些任务、工作对象、研究目标的范围基本上涵盖了哪些当前所有目前已经被认可的学科知识内容;5.上面这些所涉及到学科的衍生产物又是什么,它们是如何演变成现在这个样子的。

以上,就是关于大数据相关专业、从业的一点点小小提示或建议,仅供参考。

如果你有什么不解或疑惑,可以私信联系。

#免责声明#

①本站部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责。

②若您需要商业运营或用于其他商业活动,请您购买正版授权并合法使用。

③如果本站有侵犯、不妥之处的资源,请联系我们。将会第一时间解决!

④本站部分内容均由互联网收集整理,仅供大家参考、学习,不存在任何商业目的与商业用途。

⑤本站提供的所有资源仅供参考学习使用,版权归原著所有,禁止下载本站资源参与任何商业和非法行为,请于24小时之内删除!

给TA打赏
共{{data.count}}人
人已打赏
生活杂谈

【一人食】#18 烧椒皮蛋

2023-6-23 0:00:00

生活杂谈

法庭上对答如流的 菲尔·斯宾塞 收获了一波人气

2023-6-25 0:00:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索