上学笔记TF045:人工智能、深度学习、TensorFlow、比赛、公司

人为智能,用微机实现人类智能。机器通过大气教练多少操练,程序不断自我学习、修正训练模型。模型本质,一堆参数,描述业务特点。机器学习和纵深学习(结合深度神经网络)。

传总括算机器下棋,贪婪算法,Alpha-Beta修剪法配合Min-马克斯(Max)算法。
AlphaGo,蒙特卡洛树搜索法(Monte Carlo tree
search,MCTS)和深度卷积神经网络(deep convolutional neural
network,DCNN)。估值网络(value
network,盘面评估函数),总结盘面分类。策略网络(policy
network),总括每个棋概率、胜率。训练模型过程,分类方法得到第一手策略,直接策略对历史棋局资料库举办神经网络学习(深度卷积神经网络)得到习得策略,强化学习自我对局(蒙特卡洛树状搜寻法)得到改革策略,回归全体总括拿到估值网络。Google《Nature》随想,《Mastering
the game of Go with deep neural networks and tree search》。

纵深学习。前身 是人工神经网络(artificial neural
network,ANN),模仿人脑神经元传递、处理信息情势。输入层(input
layer)输入锻炼多少,输出层(output layer)输出总结结果,中间隐藏层(hidden
layer)向前传播数据。

多少预处理,图片,图像居中、灰度调整、梯度锐化、去除噪声、倾斜度调整。输入神经网络第一层,第一层提取图像特点,有用向下传递,最后一层输出结果。前向传播(forword
propagation)。分类概率向量,前5概率值。

纵深学习,利用已知多少学习模型,在不为人知数据做出预测。神经元特性,激活函数(activation
function),非线性函数,输入非线性变化,前向传播;成本函数(cost
function),定量评估预测值和真实值差别,调整权重参数,缩短损失,反向传播(backword
propagation)。

神经网络算法核心,总括、连接、评估、纠错、磨炼。深度学习扩张中间隐藏层数和神经元数,网络变深变宽,大量数额训练。

分拣(classification)。输入训练多少特征(feature)、标记(label),找出特色和标志映射关系(mapping),标记纠正学习不是,提升预测率。有号子学习为监察学习(supervised
learning)。无监控学习(unsuperVised
learning),数据唯有特点没有标记。磨练不点名明确分类,数据聚群结构,相似类型聚集一起。没有标记数据分结合,聚类(clustering);成功刺激制度,强化学习(reinforcement
learning,RL)。延迟奖赏与锻练相关,激励函数拿到情形行动映射,适合连续决策领域。半监督学习(semi-supervised
learning),操练多少部分有记号,部分从没,数据分布必然不完全自由,结合有标志数据局部特征,大量无标志数据完全分布,得到较好分类结果。有监督学习(分类、回归)-半监督学习(分类、回归)-半监督聚类(标记不确定)-无监督学习(聚类)。

深度学习入门,算法知识、大量数目、总结机(最好GPU)。
学学数学知识,锻练过程涉及过程抽象数学函数,定义网络布局,定义线性非线性函数,设定优化目的,定义损失函数(loss
function),操练过程求解最优解次优解,基本概率总计、高等数学、线性代数,知道原理、过程,兴趣涉猎推导注明。

经文机器学习理论、基本算法,协助向量机、逻辑回归、决策树、朴素贝叶斯分类器、随机森林、聚类算法、协同过滤、关联性分析、人工神经网络、BP算法、PCA、过拟合、正则化。

编程工具(语言),Python解释型、面向对象、动态数据类型高级程序设计语言,线性代数库、矩阵操作,Numpy、Pandas第三方库,机器学习库sklearn,SVM、逻辑回归,MATLAB,R,C++,Java,Go。

科技美学,经典杂文,最新动态琢磨成果,手写多少字识别,LeNet,物体目标检测,MSCNN,博客、笔记、微信公众号、搜狐、新媒体音信,新磨练方法,新模型。

友好动手练习神经网络,采纳开源深度学习框架,重要考虑用的人多,方向首要集中视觉、语音,初学最好从电脑视觉动手,用各样网络模型锻练手写数字(MNIST)、图像分类(CIFAR)数据集。

学入兴趣工作领域,总计机视觉,自然语言处理,预测,图像分类、目的检测、录像目标检测,语音识别、语音合成、对话系统、机器翻译、小说摘要、激情分析,农学行业,经济学映像识别,天猫穿衣,服装搭配,款式识别,保险、通信客服,对话机器人智能问答系统,智能家居,人机自然语言交互。

工作问题,准确率、坏案例(bad
case)、识别速度,可能瓶颈,结合现进行业领域工作改进,最新科研成果,调整模型,更改模型参数,贴近工作需要。

传统基于规则,依赖知识。总括格局为主导机器学习,首要的是做特色工程(feature
engineering),调参,遵照世界经验提取特征,文字等华而不实领域,特征相对容易提取,语音一维时域信号、图像二维空域信号等领域,提取特征不便。深度学习,神经网络每层自动学习特征。TensorFlow深度学习开源工具。

TensorFlow襄助异构设备分布式总括(heterogeneous distributed
computing)。异构,包含不同成分,异构网络、异构数据库。异构设备,CPU、GPU主旨协同协作。分布式架构调度分配总括资源、容错。TensorFlow协理卷积神经网络(convolutional
neural network,CNN)、循环神经网络(recurrent neural
network,RNN),长长期回想网络(long short-term memory,LSTM,RNN特例)。

《The Unreasonable Effectiveness of Recurrent Neural
Networks》。Tensor库对CPU/GPU透明,不同装备运行由框架实现,用户指定什么设置做怎么样运算。完全独立代码库,脚本语言(Python)操作Tensor,实现所有深度学习内容,前向传播、反向传播、图形总结。共享训练模型,TensorFlow
slim模块。没有编译过程,更大更复杂网络,可解释性,有效日志调试。

探讨人群。学者,深度学习理论研商,网络模型,修改参数方法和申辩,产耱科研战线,理论研讨、模型试验,新技巧新理论敏感。算法改进者,现有网络模型适配应用,达到更好立人日木,模型改进,新算法立异应用现有模型,为上层应用提供非凡模型。工业研商者,了解种种模型网络布局、算法实现,阅读非凡随笔,复现成果,应用工业,主流人群。

TensorFlow工业优势,基于服务端大数据服务(Google云平台、搜索),面向终端用户移动端(Android)和嵌入式。模型压缩、8位低精度数据存储。

TensorFlow特性。低度灵活性(deep flexibility),数据流图(data flow
graph)数值总计,只需要构建图,书写总计内部循环,自定义上层库。真正可移植性(true
portability),CPU、GPU、台式机、服务器、移动端、云端服务器、Docker容器。产研结合(connect
research and
production),快捷试验框架,新算法,锻炼模型。自动求微分(auto-differentiation),只需要定义预测模型结构、目的函数,添加数据。多语言补助(language
options),Python、C++、Java接口,C++实现基本,Jupyter
Notebook,特征映射(feature map),自定义其他语言接口。优化性能(maximize
performance),线程、队列、分布式总括辅助,TensorFlow数据流图不同总结元素分配不同装备,最大化利用硬件资源。

采纳商店。Google、京东、HUAWEI、Uber、eBay、Dropbox、Airbnb。

2016.4,0.8版支持分布式、多GPU。2016.6,0.9版补助活动装备。2017.2,1.0版Java、Go实验API,专用编译器XLA、调试工具Debugger,tf.transform数据预处理,动态图统计TensorFlow
Fold。

机器学习赛事。
ImageNet ILSVRC(ImageNet Large Scale Visual Recognition
Challenge,大规模视觉识别挑战赛),对象检测、图像识别算法。二〇一〇年始发,最大图像识别数据库,1500万张有记号高分辨率图像数据集,22000档次,比寒用1000体系各1000图像,120万教练图像,5万验证图像,15万测试图像。每年邀请有名IT集团测试图片分类序列。Top-1,预测输出概率最高类型错误率。Top-5,预测输出概率前五系列错误率。2016,CUImage目标检测第一,商汤科技、香港普通话高校;CUvideo视频物体检测子项目第一,商汤科技、香岛闽南语高校;SenseCUSceneParsing场景分析第一,商汤科技、香江闽南语大学;Trimps-Soushen目标一定第一,公安部三所NUIST录像物体探测五个子项目第一,瓜亚基尔新闻工程大学;Hikvvision场景分类第一,海康威视;
Kaggel,二〇一〇年创立,数据发掘、数据解析预测竞技在线平台。集团出多少出钱,总括机科学家、地理学家、数据数学家领取任务,提供解决方案。3万到25万日币奖励。
天池大数量比赛,阿里,穿衣搭配、网易互动预测、用户重复购买行为预测,赛题攻略。

国内人工智能集团。腾讯优图、阿里云ET、百度无人驾驶,搜狗、云从科技、商汤科技、昆仑万维、格灵深瞳。
陌上花科技,衣+(dress+),图像识别、图像搜索、特体追踪检测是、图片自动化标记、图像录像智能分析、边看边买、人脸识别分析。旷视科技,Face++,人脸识别精度,美颜,支付。科大讯飞,语音识别、语音合成、语言云、分词、词性标注、命名实体识别、依存句法分析、语义角色标注。地平线,嵌入式。

参考资料:
《TensorFlow技术解析与实战》

欢迎付费咨询(150元每刻钟),我的微信:qingxingfengzi