Some notes sometimes I thought

20190528

df595149790.github.io/cike/readme_en

刺客传说,增加了更多视频,以及关卡地图的详细设计。几个老外游戏从业者,很认真,今日告诉我,他们已经回到自己的国家,准备看我们的游戏介绍,国内没有看,原因是GitHub访问,在国内太慢了…….[Sob]。我们以前并不相识,只是在一场聚会上见了一面,并聊到了我们的游戏。但是,他们愿意花费时间来了解,并提出建议,哪怕,已经过去了2周的时间😄,谢谢。尤其是,那个本人来自美国但祖父来自芬兰而又长得像雷神的,帅锅😄

20190526

2名数学家或发现史上最快超大乘法运算法,欲破解困扰人类近半个世纪的问题MIT脑洞研究!只听6秒语音,就知道你长什么样,效果好得不敢信

“年龄、性别、嘴巴形状、面部骨骼结构,所有这些都会影响人发出的声音。此外,语言、口音、速度通常会体现出一个的民族、地域、文化特征”,嗯,这也是统计概率吧😄。技术到没有什么特别的,反而是思路和架构设计,比较有趣。对于模型“中间特征”的使用,是他的亮点。这种特征数据,找到合适的重用场景,就会有很多有趣的,也是有用的应用,例如……查找可能的罪犯😄

Pythia:Facebook最新开源的视觉、语言多任务学习框架

“we call our approach Look, Read, Reason & Answer (LoRRA)”,这是个很有趣的项目,也是很有意义的想法。视觉,目前主流的应用,是对象识别,通过大量的训练数据来实现,而语言,目前主流的应用,则是理解词素关联,即建立不同词素组合搭配的使用规则,也通过大量的训练数据来实现。但是,能不能看图识字?能不能从视觉中推理出更多内容?这就是LoRRA模型的目标,而Pythia则提供了工具,来实现这个目标。它目前能实现的视觉推理,还比较直接,只能处理直接的视觉元素,难以进一步推理出视觉图像中不存在的内容。当然,可以改进啦,配合谓词演算和知识图谱,是可以进行更复杂推理的😄。至于中文么……中文数据集太少了,那么可以迂回处理,先中文翻译为英文,在英文推理,然后英文翻译为中文😄。哎,国内企业,愿意share数据集的,太少了,google的open image数据集,都v4版本了,千万图像,这才是有vision的操作吧

20190525

2名数学家或发现史上最快超大乘法运算法,欲破解困扰人类近半个世纪的问题

“在大数相乘领域将一种来自于信号处理技术领域的被称为快速傅立叶变换的方法引入了该领域”,哈,FT傅立叶变换的思想,真是无处不在呀。通过运算,大的对象,可以分割成许多小的组成部分,而多个小的组成部分,则可以形成大的对象。这,还真是我们宇宙的运行机制呀,至少在宏观物理领域,符合这个规律。至于量子领域么……如果,我们选择合适的运算函数向量,不局限于傅立叶变换所限定的周期性,理论上也是可以组合出运动规律的。不过,这样的数学公式,其实意味着,我们可以对,时间轴,进行回溯,也意味着,我们可以预测未来。此时,量子的观测性,还会不会是一个问题呢[Sob]。嗯,计算机中乘法比加法速度快,这与计算机的体系结构有关。目前的计算机,基本上是基于二进制逻辑,硬件也是二进制,通过与非门实现。而在二进制中,乘2,等价于,左移一位。移位器,则是CPU的核心设计,很高效。通过将十进制乘法运算,分解为二进制乘法与加法的运算组合,完全可能比单独的加法运算,速度更快。嗯,看到了吧,这里也出现了,傅立叶变换的思想😄

可穿戴式VR运动系统WalkOVR在四小时内达成众筹目标

“WalkOVR的工作原理是将四个传感器连接到用户的腿上,每条腿各有两个传感器”,这是基于惯导的动作捕捉。与Mark点动捕相比,成本会低一些,但是精度不足,算法复杂,要校准,去除噪声,解决漂移问题。纯视觉的动捕方案,算法会更加麻烦些,适合于精度要求不高的场合。不过,要想做的好,内置人体骨骼模型,是少不了的。不考虑性能问题,骨骼运动模型与传感器数据的融合,是好算法的关键。上次遇到AIMS的朋友,他们用单个IMU传感器手环,帮助实现羽毛球动作的训练,倒是有趣的想法,但是还有很多改进余地,例如手部细节动作的检测。嗯,惯导+视觉+骨骼运动模型,应该会有更好的效果,可惜,鼻子都能想得到,运算量很大[Sob]

造机器人盖房子,有人又有钱的碧桂园还差点什么?

“建筑机器人需要在室内外的非结构化环境下工作,对机器人的智能化水平要求更高,涉及人工智能、SLAM算法、激光传感等技术,来应对跑动摆放,楼层变化,基准不断丢失等难点”,技术上确实有难点,但应用场景确实巨大,桂闭园的野心也很大。上次去前海,偶遇博智林的机器人研发,他们做的是货运AGV,搬移他们自己定制的标准化文件柜,小一些的机器人,一次搬运一台文件柜,大一些的机器人,一次搬移三台文件柜,挺有意思。简单聊了聊,已经场景固定,用于办公室空间,因此技术方案不复杂,SLAM地图初始构建好+自动避障+指定任务地点,激光雷达+ToF视觉+超声波雷达,传感器不多,算法也相对简单,但是,只能在平地运行。不过,博智林的研发人员,感觉探索欲望一般。有一个场外测试人员,一直在测试一台大的机器人,我看到了机器正面,顶部的设备与底部的设备,有些像,都是激光雷达,但是为什么要布置两个?询问他,他却无法解释,甚至对设备是什么,都不是清楚。嗯,那么他到底在测试什么呢?只是监工么?为什么不让机器人的传感器数据,在云端进行测试结果分析呢?有些奇怪…….另一方面,博智林的机器人研发,感觉重复性比较严重。机器人的设计,可以平台化,这样底层技术可以公用,没有必要让不同的团队,去做相同的事情。除非,他们有项目团队的优胜劣汰机制……

df595149790.github.io/cike/readme_en

上周遇到几位做游戏的朋友,4位老外,音乐+产品+发行+社区,2位本土企业家,发行+投资,聊了很久游戏方面的话题,感慨很多。于是,抽空写下了这篇文章,纪念我们在《刺客传说》那段时间的青春,以及我们的游戏理念和设计思路。特别是,我会慢慢放出很多当时拍摄的视频,它们,完整反映了那段打磨产品的激情岁月。另外,还会逐渐增加很多设计草图,包括关卡设计、人物设计、动画设计、场景设计、数值设计,以及一些程序架构方面的设计。愿原力与我们同在!

20190520

[报名&回顾 唯有设计,才能更好解决当代的复杂问题](https://mp.weixin.qq.com/s?__biz=MzU0NjY4ODMzMQ==&mid=2247488388&idx=1&sn=92e2c7879a477d3f8296f6a8bf04feb7&chksm=fb588fa0cc2f06b6d7572b39571b68c30701a49d0aedf726309d289f03af27ce210f565818ae&mpshare=1&scene=1&srcid=0520mLjU5Av9FvHmOAhnAe2C&pass_ticket=M1AdcGAreGWpSiLLZocSURgIyY59EduGk%2FK6WsOKUE4%2FuGNpgfpovd1uKogW35fB#rd)

“FUJI 幼儿园便是设计经理人模式的一个案例”,这是我上次参与这个交流会时,最喜欢的设计方案。圆形楼顶,让孩子可以不受限制地无限奔跑;两层空间,让孩子在晴日与雨天,都可以参与活动;而楼层间,不止有廊梯,还有树木,可以攀爬上下,还有水盆,可以接雨养花;这个幼儿园,让孩子们探索世界的欲望,成为现实,真是…..漂亮的设计👍。设计,需要考虑多方面的因素,技术、社会、心理、习惯、文化,缺少任何一个考虑,都难免成为缺陷,从而让产品,变的不人性,不好用。这,就是优秀架构师的魅力吧,他们,理解人性,理解自然,理解美丽,知道如何去构建一个令使用者喜爱的,建筑/软件/硬件…..以及一切

20190519

光波导和激光全息显示技术,谁将主宰AR眼镜的未来

“Magic Leap、歌尔、WaveOptics等厂家在产品中采用添加式表面浮雕制造工艺,而Vuzix、微软等厂商采用去除式表面浮雕制造工艺,此外BAE、dispelix、灵犀微光、Lumus等厂商也采用了表面浮雕技术”,最终看技术工艺的成熟度吧。不过,很有意思的是,企业的眼界,确实有高低,而投资人的言论,就只能听一半😄。我参加过几场和AR眼镜有关的路演,感受很深。一家华为系的创业企业,一直在做AR眼镜,却很推崇棱镜,认为目前棱镜技术已经成熟,可以开始大力推广。我觉得,他的概念,应该是混淆了,将波导,理解为棱镜。而珑璟光电,则根本不提国内竞争对手,大力宣扬自己与lumus的比较,强调自己的阵列式波导和光栅式波导的量产能力。君盛投资,因为投资了珑璟光电,因此就在现场,极力宣扬这家企业的垄断地位,强调自己的产业投资逻辑的合理性😄。但实际上,光波导量产能力,国内不止珑璟光电,还有一些,例如灵犀微光,他们的阵列式波导已经量产,并在尝试光栅式波导的量产。不过,从公开资料看,珑璟光电,技术发展的速度会快一些,量产早。而这一点,其实也是君盛投资,比较着急的原因吧,因为后来者已经追上来了,自己要尽快找下家接手😄

光场成像技术

光场,是很惊艳的技术,特别是它的参数化方程,实现了光线在任意位置的辐射强度记录,通过数学运算,就可以任意角度进行对焦,以及三维重建👍。我们可以发现,目前光场的实现方式,很类似于神经网络,但是只有2层。严格来说,是一种受限玻尔兹曼机,RBM,区别在于,它的参数矩阵,是固定的。嗯…… 深入思考一下,如果,我们首先根据任务目标,软件训练RBM,得到参数矩阵,然后按照这些参数去制造uv平面掩码硬件,并安装使用,那么,在xy平面成像后,我们将会直接获得预期的结果。这意味着,我们实现了,光硬件加速😄。这,会是很有趣的产品,因为它完全通过sensor硬件,实现了我们的感知任务,例如目标检测,而不再需要软件运算,结果,就是极大提高效率,而且还是无源器件😄。这种产品,在工业领域会比较有用,因为工业领域机器视觉的功能,相对固定,那么掩码硬件完全可以制作多个,不同类型的视觉任务,对应着不同的掩码硬件,随时随地插拔使用啦

20190516

徐匡迪院士之问揭开当下中国人工智能虚伪的面纱

“人工智能算法堪称信息行业的核武器。如此威力庞大的算法怎么样可会在网上被开源出来?”,看到这么一篇文章,不禁有些诧异,然后变的释然。因为,这些论调,是院士的观点,是博士的文章[Sob]。说实话,基本上,中国的院士,知识是过时的,思维是保守的,已经不在具有创新能力。中国的博士么?大部分,也不具有灵活应变的能力,不具有工程能力。数学是基础,这个没有错,但是与开源,没有关系。数学,是人类的抽象思维,是一种解决问题的工具。AI的数学基础,就是初等代数、微积分、线性代数、概率论、离散数学、组合数学,并不复杂,也没有必要神话。AI的范围很广,从以集合论为基础的Lisp为代表的专家系统,到ML中的回归/分类/聚集,再到DL中的神经网络,都是利用各种数学工具,对输入数据进行转换,得到输出数据。然后,叠加计算机硬件的各种限制条件,考虑时间复杂度和空间复杂度,设计出实际程序可以执行的步骤序列,这就是,算法。开源,则这些程序的具体展现,也是人类协作精神的体现,当然有自己的适用范围。如何用好开源?是使用者的能力问题,而不是开源的问题。难道我们要重头开始造轮子,才是自主可控?这,是农业社会固步自封的意识,已经,不适应我们目前这个人类大规模协作的社会了。上次参加光明的院士论坛,有人问老院士,您这个研究用于另一个领域怎么样?他却回答,我老了,没有精力,也不愿意去研究了。真是悲哀……

得用知识图谱,纯数据算法是无法对抽象概念做举一反三的知识迁移的

理论上是可行的,因为知识图谱,是人为归纳的抽象概念,而人为定义,本身就会不断变化,随时间而变,随标准而变,就像生物分类,并不只是有拉丁分类一种方法。而数学方法,特别是统计学和概率论,可以做到归纳。人类的知识,也是归纳。因此,知识图谱,是可以由算法生成的。

理论是可以,但是你说的只是生成知识图谱之后利用词向量化寻找新知识的一小部分,基础还是需要知识图谱的构建,而算法目前为止不能在没有图谱的基础上自己生成图谱内容。

The We Company 推出全新地产收购与管理平台 ARK

“ARK将受益于WeWork入驻的空间,ARK也将专注于全球门户城市和高增长二级市场的房地产资产收购、开发与管理。WeWork将于ARK自持或运营的地产项目以“空间即服务”模式服务会员公司”,WeWork终于走向了这一步,最终,则会走向资产管理,金融资本主义的典型演化模式。地产与空间相关的业务,一直是人们关注的重点,万科在尝试,soho在尝试,很多人都在尝试。WeWork的战略则很明显,租赁开始,轻资产启动,建立品牌影响力,然后向重资产进发,最终成为基金,成为财富管理公司。不出意外,AirBnb也会这样发展。那么,是好是坏?嗯,对于创新来说,没有好处,因为这个世界上,只是多了一个,钱多的没有地方花的富人,而已

20190514

RISC-V这块蛋糕,如何才能做大?

“RISC-V的指令集架构是开源的,它允许开发者自行组合已有的指令子集或添加自己的指令集,这极大地扩大了RISC-V的应用范围,使它几乎可以适合各种应用场景”,but,理想很丰满,现实有些骨干[Sob]。上次参加RISV-V技术交流会,厂家倒是来了一些,台湾美国以色列大陆,都有,也在推销他们的IP核与芯片,但是听众,却连问题都问的很少,不知道这是不是深圳的产业环境导致的,也许他们在上海和北京,会更受欢迎。对于rv来说,碎片化,相对好解决,搞扩展指令的厂家,一定会提供ToolChain,提供编译器,LLVM就可以搞定。问题,反而是兼容性。对于很多使用者来说,在产品中使用的运行稳定的lib,不管是基于哪种指令集架构,arm/x86/mips….,估计很多都找不到源代码了[Sob]。好吧,怎么迁移到rv上?给编译器也没用呀,除非提供虚拟机😄。嗯,反过来讲,虚拟机,倒有可能是RISC-V的一个未来发展思路,直接将其它isa的lib运行在rv的指令集上。只是,除了性能的技术考量外,不知道商业授权,有没有问题。

20190513

美欲开发软体机器人探索地外世界

“通过设计,致动器拥有腔室或气囊,会根据其中的空气量膨胀和压缩。通过调整软体机器人致动器腔室内的空气量,机器人可以像人的肌肉一样弯曲和放松”,这是个有趣的设计。气囊可以分割成独立腔室。背靠背的腔室,充气状态的不同,对应着不同的弯折方向。那么,这意味者,可以将这种腔室做成模块,按照需要的动态,进行组装,从而控制指定方向的弯曲。而且,多个腔室层,还可以进一步构成多层结构,共同形成一个部件,从而增加连结的强度,增大旋转的力矩,并在少数腔室破损时,提供鲁棒性😄。嗯,充气放气马达,会是核心的元件,而连结马达和腔室的气管,也会很重要,如何设计合适的马达数目和位置,如何进行气管布局,会是有挑战性的工作,就像…..PCB Layout一样😄。将气囊、马达和气管,做成标准化组件后,应该可以用软件来模拟仿真,这样会减少大量的人工调试时间,提高效率

20190512

链接已经被删除

“斯洛伐克虽是弹丸小国,但该国的出口依存度在OECD国家中最高,且全球主要车企都设有生产基地”,我挺喜欢伦敦交易员,文章有理有据,也算全面。美国的目标,是白人蓝领有工作,否则以后闹事分裂怎么办?坐吃山空,让别人养着,一向不是,新教,或者说Puritan,的精神,而是拉丁精神,因此,西班牙葡萄牙,会从当年海洋帝国的辉煌中衰落,它们发现了美洲银元和奴隶,也让自己走向了衰落。现在的欧洲么,倒是有机会复兴,大力搞基建,去建设欧猪四国,来加码工业制造业。可惜,欧盟的分裂太严重了,欧洲人对于德国人,太不信任了。加州大火,倒是让有眼光的资本家,又赚了,一如李嘉诚当年的操作,基础设施企业,不能倒闭呀,是个持久的生意,虽然,这种生意毫无创新,我并不喜欢。至于比特币么,没什么突发消息的话,就慢慢涨呗,但也不会很高,人心散了。

老兵认为在短期内中美关系会缓和。原因如下:
1、双方已经使出浑身解数。越是大动作频频,越是接近尾声。老兵戴辉经历无数大战,感受强烈。
2、中美相互依存,已经不可分割。
3、特朗普总统加关税还是在通常的贸易手段之内,并不是双方真的崩了。刘鹤副总理赴美,也意味着沟通渠道畅通。
4、之前从中国发出的船缓加关税,预计十五天才能到美国,意味着有十五天缓冲期。
5、一句话:中美是朋友,不是敌人。

缓和的看法,都是站在认为利益合作的基础上提出来的,但是trump的目标,是让资本回到美国,让制造回到美国,这与中国制造要出口的目标,是针对性的。trump加税的意义,就在于强迫中国商品提价,让美国制造变的便宜。只要还没有达到这个目标,可以一直加税….

20190510

依图科技“求索”芯片 能否实现弯道超车?

今天看到几个朋友在讨论这个芯片,还是有些感想。Yitu的这个架构,确实与Navida和Intel不同,不能放在一起比较。它最大的好处是,在视频分析领域性能很强,而最大的短处也在于,在其他领域性能会不好,虽然可以拼一下ARM核的能力,但是不会比Intel的CPU和Navida的GPU更强劲。SoC的定义,倒也准确,甚至可以看成是个ASIC芯片吧。嗯,针对安防市场来说,到底需不需要200路在一个屏幕上监控?人肯定不需要,看不过来的,都是软件自动分析,人只会看告警信息,或者指定主动任务。这意味着服务器可以多一些,不影响结果。那问题,就在于价格了,Yitu的价格会便宜,可安防不缺钱,华为海康大华也不缺ASIC能力,最后还是要拼综合资源能力[Sob]。什么样的场景,会喜欢Yitu的这个解决方案呢…….

《何以为家》为什么能赢?

“迦百农啊,你已经升到天上,将来必推下阴间”,不知道为什么,我不是很喜欢这部电影。也许,是因为电影中,所有人都表现出来的放弃,即使是主人公小男孩,经历了许多磨难,最终也选择了放弃,妹妹,以及婴孩。电影中的论调,最后指向了生育,指向了人口,但这是核心问题么?我不喜欢人多,但也不喜欢用人多作为借口,来逃避自己的责任和努力。大学同学这几天在谈论美中的贸易,其中有人谈到,美国主流穷人是这次的支持者,他们,并不想要福利救济,而是想有工作,有尊严地活着,因此,他们可以接受价格高一些的商品,因为这些商品是他们自己用劳动换来的,而不是从我们这里进口的便宜货。嗯,也许,这就是清教徒吧,Puritan的理念吧,这种理念创造了过去的美利坚繁荣,而现在和未来呢?会被华尔街的利益懒惰和贪婪,击败么?

他充分发挥情报侦察与火力优势,依托有利地形,梯次配置兵力,
16名特战队员被分成观瞄指挥、布/排雷、反装甲、狙击四个小组,每组四人,诸军兵种混编。
各小组既相互协同,又独立作战。由反装甲小组、布/排雷小组轮流担任“游击分队”,在主阵地前方运动诱敌,
吸引敌人暴露火力点与主要技术装备,主力则依托有利地形和空中优势伏击歼敌

看看俄罗斯人的战术安排,远程/进程/指挥/攻击/防守,一应俱全,全面针对现代的普通装甲部队进攻,进行阻击防守。 排雷,用于克制步兵。反装甲,用于克制战车和坦克。阻击,用于远程杀伤。 真实完美的配合,怪不得16个人,无一伤亡。

20190507

会 SQL 就能搞定 AI!蚂蚁金服重磅开源机器学习工具 SQLFlow

嗯,说实话,SQL搞AI,还是比较痛苦的。关系数据库一直是行业标准,但是由于二维表的实现限制,为了提高可维护性,关系数据库设计上有很多原则,例如3NF之类,结果搞得现实工程中,数据库表设计会比较复杂,大量的精力和时间花费在调优上,为了性能和容量。然后,各个厂家为了解决这个问题,又提供了很多扩展,例如Oracle的物化视图和各种索引格式,而sql也增加了很多复杂的结构化的语法,例如窗口操作,例如分区。嗯,导致没有几年的磨练,都不能说掌握sql呀[Sob]。这些其实都是关系表的结构限制,导致的。那么,NN的数据存储,用关系表,是否合适?文章中也提到了,特征的提取,会是比较大的问题,更别说,如果我搞个自编码器的话,怎么办?那么对于sql新语法的熟练掌握,又会是数据科学家的头大吧[Sob]。嗯,也许文档数据库更合适,而不是关系数据库。

20190505

让你吃人造肉的 3 个人,和地球的新未来

“但一次学术休假中,他开始往后整理职业生涯,想了这么一个问题:都做这么多年研究了,世界上还有什么大难题,自己可以尽力帮点小忙的?”,很好,这才是有趣的灵魂👍。学术休假的提法,上次是听王石演讲时提到,英文发音,与犹太教的“安息日”发音类似,也来源于它,目的就是为了休息和游学,而在此过程中,一个人,很有可能会迸发出重要的思考,嗯,996,是不会有这个效果的[Sob]。肉食,确实太多了,每次去餐馆,看着菜单上寥寥无几的素食,只得无奈离开。为什么人们喜欢吃肉?有种研究认为,是肉食中的某些激素,让人产生了上瘾的神经反射,嗯,类似于毒品的化学反应。除了调料的作用,以及肉类纤维空间组织结构外,研究者倒是还可以从这个角度来研究,提取出肉类中令人上瘾的激素,然后添加在人造肉食中,这样,也许会增加人造肉食的接受程度,让我们有更多的素食😄

20190504

【Festo仿生】工业遇上神秘海洋,来次优雅的水中漫步

“纵鳍采用柔软的硅胶进行制作,并且固定在了九个小型杠杆臂上,两个小型伺服电机负责驱动,可以做到精确的单独运动”,这是我最喜欢的bionic机器人之一,BionicFinWave!只用了三个电机,就搞定了水下运动的三维方向,真是设计上的天才👍。而且,从波浪形的鳍造型看,直觉上,鳍驱动电机的扭矩,不会要求太大,因为,可以借助水的反向推力😄!不知道,它的运动控制方程,是什么样的。如果是回归模型,那么需要考虑的参数虽多,例如水的密度、水的压力、障碍物距离、自身质量、转弯弧度等等,但应该可以通过流体力学分析,计算出来。如果是参数模型,那就需要通过仿真模拟,生成大量训练数据,才能得到,否则无法实际运行的[Sob]

有幸参加了打边炉举办OCT Talk,真是漫长的…..体验,12位讲者,7个小时,90位听众,空气山内,思想激荡,身体痛苦,灵魂愉悦。从建筑设计开始,延伸到艺术感觉,室外、室内、窗户、小说、智识、直觉、进化、诗歌、城市、撕裂。嗯,我喜欢“小说”的讲者,她谈到了自我的重要性,因为,每个生命,就是作为生命而存在。我也喜欢“直觉”的讲者,他讲解了建筑功能,如何协调与周边人群的关系,让我意识到思考的深度。我也喜欢“撕裂”的讲者,他从画家的角度,讲解了油画技法的发现过程,让我理解到思维的局限性,和智慧拓展的方法。诚如“诗人”讲者所说,深圳的氛围是独特的,谈谈的人际关系间,每个人都在追求理想的自我。嗯,不过,建筑,相比于其他形式,我始终认为是独特的,是多方面的矛盾体,architecture ,深刻影响了软件领域,也深刻影响了我,我喜欢建筑

Science重磅:史上首次!MIT研究用AI控制动物大脑活动

“研究人员创建了大脑的视觉区域V4中的神经元和计算模型中的节点的一对一映射”,这是核心,其他的就是测量了。这篇文章很有意思。实际上可以看成,它做了一个由人工神经网络组成的机器大脑,这个机器大脑,与蛋白质神经网络组成的动物大脑之间,可以互相交流,理解对方的意图,并传递自己的意图。这很重要,特别是机器大脑生成的所谓“controller图像”,逻辑上看,就是一种语言,或者说文字,是能够让动物大脑理解的文字。而机器大脑,则通过训练过程,获得了这种文字的字典。从此,我们完全可以,指着猫的图像,让机器大脑翻译出“controller图像”语言的单词,然后将这个语言单词写下来,展示给其它动物看,而那个动物的大脑,就会立刻明白,我们到底在指什么😄,更进一步推想,动物大脑多个神经元亚群之间的时间激活序列,是不是对应着语言中的短语,或者句子?如果能够找到这样的映射关系,那么机器大脑完全可以按照时间顺序,输出“controller图像”文字单词的序列,从而让动物大脑,明白更加复杂的语义。再进一步推理,控制动物大脑,就会变得轻而易举。而这里所说的动物大脑,包括人类自己[Sob]。嗯,文章翻译的不好,多看几遍,会理解的更深吧

20190502

鬼都藏不住,人脸识别新突破!就算遮住半张脸也能100%被识别

“研究团队使用了余弦相似度CS和线性SVM分类器,团队测试了其他分类器后发现CS和线性SVM的效果最好;团队发现这两个分类器能够更准确地分离数据”,Cos相似度准确性更高,倒是符合直觉,毕竟它度量的,是向量之间的夹角,向量方向如果一致,长度只是缩放了,不影响相似性。SVM中,Linear比RBF有效,倒是挺有趣,也许是特征提取的噪声太大了,导致RBF径向基函数训练过拟合了,不如Linear线性的抗噪好。嗯,有趣的观察是,从图中可以发现,眼睛,是面部识别的关键。以前与一些朋友聊天,谈到如何规避人脸识别?那么,这篇文章指导我们,带个佐罗面具,大概率无法被识别😄,看来,电影也是有科学根据的。嗯,或者,化个妆,眼睛着重化妆,改变间距+改变高度+改变长度,都会降低被识别的概率。不过呢,推理来说,这些化妆技巧不能一起用,否则只是scale缩放了一下眼睛,识别率还是很高[Sob]

全程快捷键!硬核小哥超快配图1700页数学笔记,教你上手LaTeX+Inkscape

“他说,在自己右手使用鼠标的时候,使用这些快捷键的会更舒服、更顺手一些”,哈,这个家伙终于出第二篇文章了,上次只是详细介绍了Vim中LaTex写数学公式的技巧,并没有细讲图形绘制技巧,他的quora也只有淡淡的一句话。那次,我想了半天,最终弄明白了Inkscape与LeTax结合的思路,他要是早些写这次的文章,该多好[Sob]。嗯,快捷键确实是很有用,用IntellijIdea和Photoshop时,第一步就是先更改Shotcut,改成自己喜欢的😄。提高效率嘛,目标是,编程时全键盘操作,绘图时左右手联动😄。不过呢,很多软件的快捷键,缺省设置很脑残,双手操作不说,单手还要几个指头撇的很开,真不知道厂家怎么想的,反人类的体验….

戴姆勒:回归引起的驾驶员头部姿态估计

这是篇有意思的文章。DMS系统现在突然热起来了,但从厂家的宣传看,基本上都是用DL来进行视觉处理,商汤就是典型。不过,戴姆勒的做法,别具思路,用ML来做。它通过Laser收发系统,组成一个数据采样系统,构建GroundTruth数据,该系统并不会提供给用户。然后,使用最终产品,即双目Camera,获取实时视频Sample数据,与Truth数据进行对比,训练参数,核心思想,就是将Sample数据映射到Truth数据上。而训练使用的算法,是ML中的几种, SupportVectorRefression、 RandomForest、 ExtremeRandomTrees, 没有神经网络。嗯,这种做法,好处会很明显,推理速度快、训练数据少。如果用DL来做,模型的压缩,很考验厂家的技术能力。深度学习热起来后,人人都想深度一下,传统算法好像再也无用了[Sob],但是戴姆勒的例子,反而不跟风,善于利用技术,解决实际问题😄

在中国,推行电子病历为何那么难?

元数据是一个原因,改变医生的习惯,则是主要原因。其实,这正是技术可以发挥作用的地方。为什么一定要医生手工录入?camera和mic完全可以实时记录诊所的情况,然后通过nlp理解医生的谈话,自动记录。手写的病历,可以替换为手写平板,医生一样用笔录入文字,通过笔迹识别技术,自动记录。患者,则通过扫描二维码,通过h5页面,实时查看病历。至于笔记的训练,旧病历的ocr可以解决。技术上会有一定难度,但这也是技术公司建功立业的时机呀😄。but,反过来想,厂家有什么动力去做电子病历呢?医院有什么动力让医生使用电子病历呢?这才是问题的根本吧,利益没有流动起来。也会不会使用顺畅[Sob]

20190501

彭晖:特斯拉出事不意外 做L5级自动驾驶是浪费钱

“理论上来讲,假设通过车祸我们收集到大量资料、数据,用这些数据去调控控制策略、训练神经网络,在实验室里做大量的计算,让机器学到如何不犯同样错误,这是可以做到的”,这个思路是合理的,也是黑盒子的意义,也是仿真测试的意义。只是,他的观点,略显保守。前几天参加OFWeek举办的车联网论坛,广汽研究院的L4L5技术总监,再次表达了“不接受5个9”的观点,即自动驾驶要保证极端安全。嗯,我觉得,这可以追求,但是也可以换个思路。人类使用机器,目的是简化操作,安全不是第一位的,也无法做到绝对安全。AD可以让人不再保持紧张注视前方四肢发麻,很多人愿意改变这个体验,哪怕付出一些安全上的代价。所谓安全,本身就是动态的,车速20与车速80,安全标准并不同。强调绝对安全,是车企对于自身责任的防御,因为,号称从L4开始,汽车要担负车祸责任,即,AD厂家承担法律责任,而另一方面,不宣传安全的话,车企也会担心销量😄。嗯,问题是,这样的责任判断标准,本身就不合理,人类应该具有最终选择权并承担后果。那么,汽车的运行模式,完全可以由人类个体进行选择,而不是车企统一固定。这个问题,对于RoboText运营商,可能会是个问题。解决方案有没有?maybe,人类远程驾驶,会是一种,出现问题的Car,由远程人类接管,解决问题后继续自动驾驶,而汽车的Sensor默默记录了一切,算法进行强化学习,云端传播学习后的模型。在未来社会,普遍的机器运行 + 少量的人类调整 = 动态进化的、运行足够好的、服从人类意志的,自动驾驶系统😄

晚上偶尔看到了Jazz的信息,冲过去参加了这场音乐盛会,国际爵士日,很Nice的感觉。Jazz是我来到深圳后,才开始喜欢的音乐类型,当年在JazzGarden逗留良久,大冬天,一个人,喝着冰黑啤烤着暖风机听着爵士乐😄。Jazz风格多变,现场表现成分居多,而且队员乐器之间的配合、礼让、比拼,娓娓道来,同一个乐队,同一首曲子,每次听来,却都是不同的感觉。我很喜欢背景墙上的JAZZDAY几个英文,设计感强烈,线条流畅,盯得久了,真的能让人浸入到那旋律的维度中,视觉与听觉的感受,已然一体。有一刻,脑海中,不禁想起了时间与认知的关系,为什么人类的大脑,会感受到旋律?与时间的关系是什么?LSTM与CNN能否统一?[Hammer]好吧,好好听音乐,放松和休息,就像王石前几天在北大汇丰商学院YGT论坛上讲的,以色列是会休息的民族,而我们也要学会休息😄