杂想。201908

“更倾向于让它变成游戏的‘多面手’,能解决人类指定的大量简单又宽泛的任务”,是,通用人工智能的基础版。简单看了看FB的论文,数据集有些意思,是 Minercraft 玩家众包构建,目前只包括房屋,以及房屋的风格描述,比较简单,但是思想已经很明确了,属于监督学习,理解玩家语义后,发送对应的游戏指令。其实,这个如果进一步扩展,是可以训练算法来做更多事情,例如…..编程😄

“现代化的时间观,本质上是对时间工业化和市场化的改造”,是,从时间利用率的角度来看,文明程度高的民族,会有复杂的计时仪器,就像古中国的日晷,古希腊的三角测量,以及大航海时代的六分仪。我们的宇宙,真是很奇怪,时间到底是什么?对于时间的感知,以及如何处理时间,导致了我们这个四维空间的丰富多样,例如,速度快,则时间会变慢,保存记忆,则需要付出存储空间,短时间内实现更多的结构化操作,则需要消耗更多的能源….如此看来,时间是一个参数,用来在四维空间中实现某种守恒。如果,我们想操控时间,该怎么办?四维空间中需要付出极大的成本,而…..更高一层的五维空间中,也许这种付出会小很多。就像四元数,quaternion,通过将三维向量变换到四维空间,然后在变换回来,优美地解决了三维向量的空间旋转问题,也让插值处理,变得简单。这就是抽象,或者说规则,的意义吧。

肯尼亚哲学家约翰·姆贝提(John Mbiti )将没有历法的非洲人传统的时间观用斯瓦西里语中的两个词来总结:Sasha和Zamani。 
 Sasha的本义指尚有在世之人曾认识的亡灵,Zamani则是不曾被任何当今之人所见过的古老亡灵。

非洲人认为,当一个人离世后,他并没有“完全”死去,而是尚活在生者的记忆里。只有当最后一个曾经认识他的人死去后,他才算真正地死去,即从Sasha变为了Zamani。

“福特已经拿到了传感器清洗方面的50项专利”,这是严肃车企的打开方式!既然是自动驾驶了,那人类就不应该做机器的奴隶,机器需要自己清洗自己😄

“远程监督的前提就是提一个靠谱的假设”,这就是为什么我们一直在说,AI有偏见,因为…..数据有偏见,数据是精心构造的,而人类,还专门写了这样的文章,讲述如何构造高质(偏)量(见)的数据集[Sob]

“插入在音乐通廊上选好的CD,带上桌上备好的耳机,你就可以隔开外界自成一方天地,感受被音乐和书籍包围的惬意”,我喜欢南之山的森林阅读区,但是…..不喜欢他们的座椅。不知道是否故意为之,空间中的座椅,都是方正为主,日式蒲团,与明式家具,看起来美观,实际上极不舒服。看书时,我喜欢将自己扔进大大的沙发中,让腰部受到有力而柔软的支撑,让书籍的重量分布在手臂与扶手间,让思维….随着作者的文字,惬意地思考与质疑。嗯,禅宗清修的无色无相,朱明理学的天理人欲,工业时代的秩序效率,并不符合人性,特别是对于阅读,这种批判性思维张扬的场景。现代的西方家具设计,已经开始注重贴合人性,就像……宜家的小沙发,充满了曲线感。是的,曲线,是我们自由意志的表示,representation,就像机器学习中的SVM算法,核函数,简单而有力量

谢谢辉哥。说实话,金融领域很难有垄断出现,传统金融服务还可以,高盛就是凭借对于资源的把握和对于客户需求的理解,而占据了金融服务业的领头羊,客户会主动找它。但是分布式金融,与这个目标是互斥的,它设计目标本来就是降低门槛的,让信息扁平化。因此,分布式金融领域,如何赚钱?平台作为入口,是一个方案,更加细分垂直的服务,是另一个方案。MakerDAO我不觉得它占据了任何一点,只是较早出现而已,而服务并没有特色,很容易被后来者复制和超过。品牌能不能成为门槛?分布式金融领域,也许很难,因为是自治的,品牌对于客户的意义不大。另一方面来看,金融是一种手段,用于交换物品,包括物理物品和虚拟物品。目前的分布式金融,其实在交换自己,即金融脱媒,风险巨大,当然高手收益巨大。那为什么没有人愿意做与物品交换的服务呢?因为太麻烦了,物理世界需要和政府法院打交道,不够快速。那,到底交易速度多快,才是合适的?人类的反应有限制,意味着分布式金融,不可能太快。但是,机器的反应速度,可以很快。那么,分布式金融,未来的参与者,是不是机器人会变成主流?个体人类如何管理这些机器代理?也许这会成为一个可能的创业机会吧😄

比如,汽车即服务,提供云服务,支持汽车共享、拼车和车队管理模式。汽车健康和诊断,帮助建立与车主的关系,同时增加经销商服务收入。 
 此外,还包括车辆连接,允许车辆通过云与智能家居、智能基础设施等其他平台进行通信;SmartAuto,为无法访问云的车辆提供连接,支持媒体传输、车辆诊断和车辆跟踪等功能。

“宿主的饮食和新陈代谢是如何与微生物共同进化的”,是的,微生物组,对于生命来说,是不可或缺的。这段时间再看《I Contain Multitudes》,里边就提到了弓形虫,这是一种细菌,被猫粪便排除体外后,如果进入老鼠体内,会影响老鼠的大脑,让老鼠喜欢猫,想强奸猫,然后跑到猫跟前…..被猫吃掉,而弓形虫,则完成了自身的成长,真是有趣。细菌,或者说,微生物,充斥着我们这个世界,我们自身细胞中的线粒体,本身都是一种古老的细菌,被古菌吞并,构成了真核细胞,才演化出了如此丰富多彩的生命世界,令人赞叹👍

History🏆 Weili Zhang is the first Chinese UFC champion🇨🇳 knocks out Jessica Andrade in 42 seconds

“他记录了 91970 个单词,训练出一个对话AI“Dadbot”。通过“Dadbot”,他可以与逝去父亲的计算机化身他交换文本和音频信息,谈论他的生活、听歌、闲聊和说笑”,对于能实现这个bot的你我来说,理性地讲,亲人的记忆,会永存于心底,不会随着自己的衰老而流逝。而感性看,每个人都有脆弱的时刻,希望亲人环座四周,获得一刻心灵上的安全和放松。因此,这个想法,是不错的想法。至于性格的保持,即所谓个性,也通过NLP建立特征参数,然后不断加入新的社会环境,让bot持续进化,让听者保持新鲜感,这样的系统,会更加有意义吧

“如果能够让模型学习到海量文本中蕴含的潜在知识,势必会进一步提升各个 NLP 任务效果”,是,这符合直觉。百度的ERNIE对BERT举行了改进,可以看成是分词后,再进行词嵌入,但这里的“词”,是分词语义单元,而不是文字单元。英文,也可以这样处理,将短语作为词嵌入的“词”。概念上看,这种方式,其实是构建了一个知识图谱,即通过训练的方式,自动构建了知识图谱。而且,它具有一定的维度特征,比手工构建的知识图谱,更加全面,也更加紧凑。至于动态更新问题,倒是词嵌入方案都会存在的问题,可以纳入统一流程框架中

“给机器人加入精准传感器,实现微流体给药,超声以及电治疗功能”,很有趣的设计,还没有仔细看论文,不知道是否需要控制柔体机器人中后段,虽然水溶胶可以降低摩擦力,但是摩擦力并没有消除,路径积累后,摩擦力可能变得很大,那么如果只驱动头部的话,驱动力可能会不足。因此,分段驱动,也许是更合理的方式,而这,就需要算法,来统一控制“多段磁力控制马达+扫描图像”,构成反馈,做到机器自动化手术

“DREAM将对金属CNT纯度的要求放宽了1万倍左右(从半导体CNT纯度要求99.999999%放宽到99.99%),不需要额外的加工步骤或冗余”,这是天才但也符合逻辑的创意,既然不是所有的CNFET类型,都会对金属纳米管敏感,那么就通过算法,来排除那些敏感的类型,只用能用的类型😄,而这,也充分反映了EDA软件的重要性,先进的工艺,一定需要软件来配合,国产EDA需要加紧步法。嗯,前段时间参加美格纳半导体的交流会,三大EDA巨头虽然都有展台,但明显不大,看来贸易战的影响,还是不小。不过,韩国人倒是说了,要全力进军中国,嗯,他们很有商业头脑👍

“如果打不过他们就和他们组成团队吧”,是的,继续向前走。那么,前方是什么?有些人选择抵抗,维护现在的状态,或者说,过去的状态,例如保护XXX防止XXX……。有些人选择接纳,未来不可避免,也不需要避免,而是自己需要去改变,例如去火星殖民……。殖民这个词,很多人不喜欢,但是,地理扩张+人口繁衍,就是殖民的含义,我们去火星,如果不是去殖民,那是去干什么呢?最终,抵抗与接纳,形成不同的进化,而技术的进步,会促使这种进化的分叉。未来,地球种族的长者,会指着火星并教育下一代,那帮叛徒都是靠压榨我们才活到现在,而火星种族的年轻人,则看着地球,热烈地互相讨论,如何保护这些濒临灭绝的物种。

一只能加Buff的忠诚猎犬,当然还有丹尼尔留给所有人的赠言:照顾好我的孩子,他也会照顾好你的

“国外的特效公司为了省钱,还普遍使用的是好几年前的老版本。老外来中国看着我们的电脑问,为什么你们这么有钱都用的最新版”,为什么没有人,愿意宣扬一下CG软件的自主可控?因为没有开源版本么😄?ARM对盗版,就抓的很紧…….

“重要的是还要寻找只需要复杂到它们所需的程度的网络架构”,开源是个好东西,现在一堆公司都说自己有核心技术,嗯…..都在等别人的开源😄。NAS是未来,权重搜索,反倒是更加通用的逻辑,架构搜索,如果看成是图的优化,那也算是一种权重搜索吧。集成学习的想法,倒是很有趣,抗噪声,滤波,这个也许是模拟生物神经机制的,好机制😄

“秒表、水浴锅、提篮……构成了最初期的PCR操作系统,和现代高端的PCR仪有着天壤之别”,技术的进步,需要坚持。然而,真正伟大的发现和创造,源于兴趣,源于探索未知的动力,然后去实践,去检验,然后,让结果,伴随时间前行,无论喧闹与寂寞。有时候与一些投资人交流,他们最喜欢谈论两点,是不是痛点?是不是有收入?好吧,虽然投资方都有自己的压力,但是对于未来的判断,到底需要多久?上帝的归上帝,凯撒的归凯撒,阳光底下并无新事

“原始森林指的是那种存在了很久并且没有受到显著人为干扰的森林”,这真是令人惊艳的设计,简直令我有了将它改造成游戏的冲动,竖版/从上向下/多层场景+探险/解密,拥有那款老外的“老人寻找回家路”的游戏感觉,拥有令人沉浸在森林中的感觉……

“如果所有人都不同,为什么现代建筑中的公寓都要如此相似?”,是,为什么要想同?这也是来自日本的帅哥青山….的建筑理念😄。我喜欢这栋建筑,每间房屋都能遇见美好,阳光海面沙滩城市……,虽然,它靠海一侧的楼层,明显高于远离海洋一侧的楼层,反映了开发商赤裸裸稀缺资源坐地涨价的无耻逻辑……

“憋回去的屁不会凭空消失,它会通过呼吸或打嗝的方式,或是以一个更大的无法控制的响屁放出来”,嗯,这就是所谓“屁守恒”😄,从生物学角度看,屁作为一种气体,没有在肠道内被及时融于体液然后吸收,说明体内压力不够大,气体难以融于液体,那…..六块腹肌,能不能帮忙?

“best results with nearest-neighbor interpolation, bilinear interpolation resists high-frequency image features too strongly”,细节是魔鬼。deconv的替代方法中,最近邻像素,简单粗暴,但是效果好😄

best results with nearest-neighbor interpolation, bilinear interpolation resists high-frequency image features too strongly

“3D-AR-HUD的绝大部分图形是实时动态生成;信息投射到三维世界,驾驶员视线在物理空间移动,也不会导致图像失配,所以驾驶员视线活动空间更大”,很有意思的设计,技术实现上,通过SLAM感知空间,通过对象识别发现真实物体,根据场景创建新的提示物体,然后,构造一个融合后的虚拟三维世界,并通过显示屏或全息,投射到座舱玻璃上,这……真是迷人的体验。嗯,进一步,支持多人的同时观察后,那么我们在汽车中的体验,将迎来真正的视觉时代

速度与激情,巨石强森的萨摩亚战斗,真是激情澎湃,我不禁好奇,然后就…… GoogleEearth 了下这个南太平洋的岛国。萨摩亚,分为西萨摩亚,和东萨摩亚,西撒独立,东萨属于美国,因此电影中的场景,应该是在东萨拍摄,然后,就找到了几个疑似场景地😄,很漂亮。萨摩亚人种,属于波利尼西亚人,按照目前的主流科学解释,是最早从非洲走出来的人类,他们一直沿着中东、西亚、印度次大陆、印支半岛、马来菲律宾,一路迁移到了这里,真是人类的奇迹,在《钢铁、疾病和细菌》一书中,就有大量的波利尼西亚调查资料。最令人惊艳的,是他们的航海术,可以在2万年前独自穿越2千公里的无岛屿海面,叹为观止。迪斯尼的《海洋奇缘》就讲述了这个故事,里边的半神毛依,是波利尼西亚人。而摔角界的巨石强森,也是波利尼西亚人,我喜欢他们的纹身。

“预测网络,在给定先前的目标标签的情况下,预测下一个目标标签”,这是核心,即通过理解语义信息,从而推理出“当前发音人”的角色,是医生,还是病人。嗯,但这也是应用受限的因素,因为,我们需要针对每个场景,都进行数据训练,从而让网络知道,这是医院,那是教室……。理论上来说,可以将不同场景的参数,融入到一个网络中,但对于google来说,目前是第一步,因为这套系统本身就只是用于它们的医疗产品中,未来么,自然可以扩展到更多领域。技术实现上,RNN对于并行训练,确实很困难,而Attention则是对于循环处理的改进。google自己也提到了,可以将循环转化为大规模的矩阵运算,嗯,也许,他们会继续出论文,描述这个架构吧

“采用落后的工业时代的方式来管理人力资源已经难以赢得人才争夺战”,美军,真是一支学习的集体😄。西方文化中,对于组织的关注程度,相当高,军事领域尤其看重,从亚历山大的马其顿方阵,到马略的罗马军团百夫长改革,从骑士加仆从的战斗模式,到专业骑兵的快反单位,从凯撒的高卢战记,到克劳塞维茨的战争论,它们总是在调整与变革,在不断变化的世界中保持前进,很有意思。未来的战争,会是什么样子呢?如何与美军,作战呢?

“将传感器放置在志愿者前额、前臂、腋下和上背部等不同部位,测量他们的出汗率以及汗液中钠和钾的水平”,这就是我不喜欢目前可穿戴设备的原因,我太容易出汗了,而设备无法帮我排汗,湿淋淋挂在皮肤上,很舒服么?监测运动是否过量……这个需求,我觉的脑残,进化亿万年来,人体已经有了大量的内置传感器,运动过量了,身体会有反馈,口渴意味着要补水,疲惫提示你去睡觉,还需要可穿戴设备再提醒一下?嗯,为什么不去做个温度调节可穿戴设备呢?Sony最近的一款衣服,就集成了小型空调设备,这才是人性化的设计思路吧

这场战斗,也是冷兵器时代的典型,看着它,我觉得就是一幅活生生的 MBOA+RTS 的游戏画面呀,而且…..是 AlphaStar 对战 星际争霸 人类玩家 的即视感。通讯不畅+战争迷雾,导致军队需要在信息不完美环境下,进行决策和行动。罗马人,作为防守方,需要平衡 获取粮食 和 守塔 之间的战略部署,而日耳曼人,作为攻击方,需要在 消灭敌人 和 攻塔 之间进行战略部署。算法,虽然可以采用强化学习,实现动态规划,但核心,却是作战单位间的信息传递,以及对于 作战单位行为特征 的模式识别。而人类之间,作战单位的战斗决心和战斗意志,则是核心要素。算法的特征提取,人类的战斗意志,都需要日常的大量训练,才能实现。训练的成本,对于算法,是能源,对于人类,则是制度。

“IBM在美国很难找到Watson肿瘤产品的买家。一些肿瘤学家说他们更相信自己的判断而不需要Watson来告诉他们需要做什么”,在中国也很难找到买家。医生,很多时候,是技术进步的阻力,这种实际情况,如何打破?AI医疗,目标用户到底是谁?院方、医生、病人?这是所有AI解决方案,在设计和落地时,面临的共同问题

“首次迭代是为了支持膝盖,但也可以应用到其他关节上。若增加气动执行器和更加复杂的控制器,系统可以处理更大范围的臀部和脚踝运动”,是,我喜欢这种soft exosuite的设计,辅助人体部分关键肌肉,但是不影响灵活性。不只是腿部肌肉,手臂肌肉也可以增强,这样的话,我就可以去 free solo 啦😄

“他认为我们需要构建宏大的模拟模型,总有一天这些模型将模拟整个金融系统的所有复杂动态,并解决最棘手的社会问题”,我喜欢这个家伙的想法,以及它的道德AI观点。人类的未来,会运行在机器之上,机器自主的决策,本身就是一种道德

“The server of Style2paintsV4 (s2p.moe) is currently shut down because we do not have enough money”,多么诚实的痛。不错的上色程序,会让……普通画师豁然失业痛不欲生,优秀画师孓孓独立形影相吊😄

The server of Style2paintsV4 (s2p.moe) is currently shut down because we do not have enough money

“墨西哥黑帮团伙众多,他们原来大多是从事毒品贸易的毒枭,现在毒品生意不好干,他们都转行卖牛油果了”,嗯,如果上帝会后悔的话,一定会说,后悔让牛油果的核,张的那么大!黑帮的历史,也不知道怎么学的,圣殿骑士团,是这么玩的么?当年的十字军东征,为了保护朝圣的平民,欧洲的一些骑士们,组织成立了圣殿骑士团,让平民不再受到拜占庭和穆斯林的欺凌。结果,圣殿骑士团,慢慢变成银行了,因为平民会将自己的财产,交由骑士团保管,而骑士团在欧亚沿途,都有据点,可以随时提取,信用良好😄。除了圣殿,十字军东征,还诞生了医院骑士团,和条顿骑士团,前者演化为现代的红十字会,后者奠定了现代德国及北欧诸国的基础。

“LS-SVM 采用了线性方程组对 SVM 的二次规划问题加以简化,分类效率得到大幅度提高,并且引入惩罚因子使结构风险化最小。该方法更适用于处理小样本集合不均衡样本集不均衡西瓜样本集的分类”,嗯,对于LSSVM的使用场景,理解很深😄。除了声学方案,还有光谱方案,不知道哪个,会成本更低?

“在单个晶圆级的解决方案中提供了超级计算机级的计算能力、高性能内存和带宽”,这倒是真的,优化的计算核+临近的内存块+高速的通讯网,这都是超算要解决的核心问题,结果用一个芯片搞定😄,特别是,针对杂质的冗余设计,意味着这款芯片的寿命会很长,部分晶元损坏,不会影响芯片工作,只是会变慢一些,很鲁棒的特性呀👍

“床上的特征点经过一夜之后可能变得完全不同,但床作为物体却不会变”,but,当我们思考物体的定义时,会发现它的描述也存在许多定义。床,就属于主观定义,因为不同人的判断不同。方块,则更加稳定,因为它是存在于物理空间中,不随观察个体的不同而变化。所有的这些定义,我们统一则称之,特征。我们可以发现,特征的获取,可以是实例数据训练得到的,也可以是先验知识图谱灌输的。机器,如果需要与人类共存,就必须要与人类交流,获取人类灌输的知识图谱。而当机器,可以向人类灌输自己建立的语义世界观时,人类……就真正创建了一个新的物种。此时的我们,则开始了新的进化

“为什么选择 SQL 呢?为什么它们不能让开发人员使用适当的企业级抽象并编写正常的面向对象的代码呢?”,嗯,有道理,我TM就喜欢写SQL,因为一个SQL可以搞定一大坨语句😄。函数式编程,当然要更简单啦,配合重构,可以干掉旧世界[CoolGuy]。面向对象,想法很好,但是开发,太痛苦。每次理解新代码时,看着一堆get、set、construction,我就很烦躁,然后再看到每个类一个文件名,我就更加烦躁,核心逻辑到底在哪里呀?创造世界的程序员,喜欢简单有效的操作,重复性的工作,还是交给机器去做比较好,例如JetBrains😄

“dynamic range compression, increased sharpness and color, and accurate scene rendition”,这就是Retinex算法的作用😄。Retinex的思路很有趣,从入射图像中减去亮度图像,得到反射图像,逻辑符合直觉,实现简单粗暴,效果却不错,在图像增强领域,很有用,GIMP中已经有实现。嗯,以前用了很久的GIMP,虽然它的UI很难用,更新也慢,但对开源软件来说,能做到对抗Photoshop,就很值得尊重了👍

dynamic range compression, increased sharpness and color, and accurate scene rendition that is produced by the Multiscale Retinex with Color Restoration.

“使用 C++ 首先面临的开销是需要自己构建框架和库,而且招不到开发人员”,虽然我觉得Dropbox的代码很烂,丑陋的界面,但它们对于cpp的跨平台的放弃,却也合理。跨什么平台呢,cpp本来就是给大家提高性能用的,跨平台都是我们自己的意淫😄。写个算法程序,cpp还行,写前端么……太痛苦了,还不如用js呢

“get some practice for a fleet of robots that could one day search for signs of life underground on other worlds”,嗯,外星人都生活在地下😄,因为我们在地面上,看不到他们。不过,DARPA的想法,还是很有创意的,可以发现,他们搞的各种竞赛……核心都是让机械自主,代替人类。这一点,代表了西方对于未来的观点,即尽可能地去探索未知,哪怕肉体无法触及的环境,也要通过机器,让意识可达。对比我们么…..RoboMaster算是拿的出手的比赛,结果也是娱乐导向,RTS的Game罢了……那么未来,我们什么时候,才能去外太空,殖民呢?

“在 Microsoft 工具中,使用了vsdebugeng.dll 引擎,由于许可限制,其他人无法使用该引擎”,只看重金钱的丑陋M$,开源精神为什么不在windows生态上,贯彻一下?Jetbrains 虽然一直擅长工具,但是对于CPP的支持,明显感觉到力度较弱,估计与他们的态度有关,不喜欢众多程序员的cpp代码,太散漫了,一点都不优雅[Sob]。话说回来,cpp确实太灵活了,编译器自己都累的气喘吁吁,你还让Jetbrains去实现 AutoComple,还让不让他们活了😄?昨天参加了 OpenResty 的一个沙龙,主讲人推崇全键盘操作/Linux哲学/Vim开发……很像当年的我…..不过我现在,全键盘依旧,但更喜欢AutoComplet了,因为,人类个体的差异太大了,你无法在一个项目中,找到所有的神队友,而可维护性,就是为新人和猪队友,准备的手段。至于未来么……当然应该是机器自动写代码喽。印度公司AI写代码的事件,虽然闹的沸沸扬扬,但是…..作为Linux哲学推崇者,要坚信,前途的光明,和道路的曲折😄

这件 soft exosuite,虽然也是也是一种 exoskeleton,但没有想传统的辅助行走外骨骼那样,支撑到脚底,而只是拉伸大腿后部肌肉,嗯,准确讲,就是股二头肌,帮助运动中的蹬腿发力,很有趣的设计,结构简单,重量轻,适应性强。评估结果,认为可以降低9%的新陈代谢,也是很有意思的标准,人体运动中,累,有两方面的原因,肌肉代谢的乳酸积累,以及心脏的供血能力。很多时候,是因为我们的心脏无法保证供血,导致我们无法提高运动强度。那么,通过机械,减轻肌肉对于含氧血液的需求,也确实是提高运动能力的方法😄,至少,我去登山时,可以用得上。另外,灵活性,是这个soft设计最大的优点,不影响腿部的自由度,这一点是其它外骨骼难以做到的。嗯,进一步改进一下,针对小腿的腓肠肌,也提供这样的动力辅助,那就更完美了,实现上么,可以考虑模块化😄

Roborace 在 Formula E 跑道上完成 Self-Driving 汽车的竞赛,使用相同的硬件,比拼软件设计的能力,很有挑战。SpeedGoat 提供了 ECU,也开源了控制算法,包括状态管理、路径规划、车辆控制,很不错。SpeedGoat 的产品,设计挺有意思,功能包括“Speed control, Path tracking control, Sensor fusion,Vehicle state machine,, Self-designed vehicle dynamics,Real-Time testing”,主要完成传感器融合以及输出线控,用FPGA实现,可以做为一个模块,提供给其它厂家集成,并提供模拟环境,不求全不求大,倒是不错的商业模式

Speed control, Path tracking control, Sensor fusion, Vehicle state machine,, Self-designed vehicle dynamics, Real-Time testing 


“这种商业模式使其天然具有长期支出固定但收入不确定的特征,支出与收入的久期结构性不匹配会造成现金流压力”,WeWork的文化很好,空间也很好。上市是好事,对于这样的概念,资本市场还是稀缺的。美国资本市场有个特点,分析师普遍不看好的,股价却不错😄。科技与空间的连接,有很多想象空间,我们目前看到的,只是WeWork对于ARK房地产业务的投资,科技投资并没有看到,另外,员工人数偏多,绝大部分是女性,这也不太符合节约成本提高效率的科技风格。那么,未来会怎么发展呢?

这是场有些奇怪的战斗。按道理,罗马军队应该占据山顶的有利位置,而不这样做,意味着周围,山太高,林太密,不适合大部队作战。那么,当土著从山上冲下来,攻击罗马军队时,对于军队的损害,到底有多大?而军队的分散突围,却成了对于土著的分割包围?这要么意味着土著的战斗力,太差,要么意味着,罗马军队的素质,很高。后者的可能性更大,他们的装备、训练、战术、经验、指挥,都是普通人短时间难以达到的。最近看到一本书,讲述了古罗马的灭亡,观点是因为疾病导致的,而不是军事原因,很有趣

自动写代码,是我多年的梦想 后来一直在思考,如果要自动写代码,流程会是什么样子? 普通的流程,应该是,我开口问机器,写个人面识别程序 机器想了想,问我,谁的面? 我很愤怒,人面呀,你不知道人么? 机器又想了想,人怎么定义? 我有些出离于愤怒了,人就是人…..要不,就写个我的面识别吧 机器很开心的coding了,我开始考虑debug的流程 嗯,好像复杂了些😄

写代码,不在于写,在于需求分析 这点….交流时,人都理解错误,别说机器了😄

“与较小的transformer模型相比,更大的transformer模型可以在相同的时间内进行训练,并且可以显著提高性能”,这就是它被叫做 Megatron威震天 的原因吧,未来模型更大一些,就可以叫 Galvatron惊破天 了,如果……在大一些的话,还可以叫 Unicron宇宙大帝 啦😄。只是,推理2毫秒,也需要用512的GPU么[Sob]

“难怪马斯克都要过来,只有我们会认真考虑帮他在火星修基地这种事”,突然看到这篇文章,也是挺有意思的。好像我们,还真是……什么都敢干,什么都在骂。Hassabis 在 AlphaGo 战胜李世石后,专门去拜访了霍金,想继续解释为什么要做AI,因为霍金,在过去一直反对AI,担心人类的未来。但是,这一次,霍金并没有反对,只是对 Hassbis 淡淡地说了句 ”Good Luck”。也许,人类的未来,只有未来才知道。而《银河系漫游指南》的封面,也用坚定的大写字母,向世人说到,“DONT PANIC”😄

“开启Autopilot的特斯拉车每行驶287万英里发生一起撞车事故。相比之下,普通汽车每行驶43.6万英里就会发生撞车事故”,6倍的比例,还是很吸引眼球的。莫斯科的事故,很奇怪,司机没有发现卡车,Autopilot也没有发现……,那这辆卡车,谁能发现它?如果其他人也无法发现,这意味着出现了一个前所未有的数据实例,对技术是好事,对法律来说,也是好事。在这种情况下,Tesla应该是无罪的,因为在法理逻辑上,我们只是按照已经存在的事物,制定了需要遵守的规则,但无法对未发生的事情,提前制定规则。Tesla的真实驾驶数据,太庞大了,这是它最大的潜力,而它对于纯粹机器技术的追求,则是领先的保证。因为,人是不可靠不能预测的,任何时候,持久运行的系统,都不能依赖…….人

“机器人作为一个入口,手术前可整合影像和诊断数据,执行手术中可囊括手术导航与AI辅助,下可连接对应器械与耗材”,是的,技术的进步,会让机器成为人类的辅助,替代人类完成高精度高强度的劳动,以及重复性的工作。进一步,大量的纳米机器人,融入到血液中,会构成一个动态的信息传递系统,从而让我们可以随时了解体内的状况,基本减少辐射医疗方式😄

凯撒的《高卢战记》,提到了与日耳曼人战争中,提前夺取贝桑松的细节,易守难攻,地形奇特,特地GoogleEarth上仔细研究了这个地方,很有意思。贝桑松现在的城堡,应该是中世纪修建的,不是公元前58年古罗马这场战役的作品。但是,细节很丰富,真的是为了冷兵器作战而建造的专业城堡。左右两边的山崖,人工构筑了高墙,除了防止偷袭外,与前后入口处的战壕想配合,可以注入水或者油,有效减缓攻击速度。城堡入口,狭窄而低下,完全暴露在周边高墙的攻击范围内。行人通道,曲折而狭长,至少会被三面城墙从上向下夹击。翁城,连续分布,尽最大可能集中兵力歼灭敌军。这,真是军事建筑的杰作呀👍。西方的古堡,保留较多,军事构建比较明显,日本的古堡,留存的也很多,例如丰臣秀吉,其构造也是充满了防御味道。而中国,这方面,好像比较少,目前看到的建筑,平原居多,很少看到山地堡垒,嗯,是……被拆除了么?

谢谢辉哥。央行的数字货币,一直在设计,一直没有看到落实。他们的思想也一直没有变,核心是,数字货币是另一种纸币的,纸币怎么用,数字货币也怎么用,央行负责调控,银行负责中转。对于中国来说,目前这样做,也没有什么错误,货币希望保持独立,保持经济发展的隔离。但是,随着我们制造业的发展,货币全球化,会变的开始重要。央行的设计,与Libra并不同,Libra要解决的问题是,不同国家的人如何快捷交换商品,具有多货币的现实需求,也采用了稳定币的设计方案。未来央行的货币国际化,思路应该与Libra类似。Libra的问题是,实体经济可能受到影响,例如越南的产品以越南盾计价,也许比较便宜,但用Libra计价后,可能会变贵,会导致在越南不再生产该商品。但是,Libra对于虚拟商品,是好事。这对于全球央行来说,都是个问题,因为要调节经济发展。中国央行现在没有这方面的考虑,但美联储比较关注。不过,中国央行的数字货币设计上,要看具体细则,例如商业银行要抵押,用什么抵押?细节不明确的话,也有滥发风险。

“这得多大仇恨,能在白石子院子里头栽两颗落叶树”…….[Facepalm],这是我觉得最搞笑的评价。建筑的设计,第一眼看上去,觉得很好,现代装饰风+性冷淡色调+日式禅修境,令人有种居住在里边的…..想象感。然而,继续想象下去,我却忽然觉得不适。为什么呢……..想来想去,我发现,是这种生活环境的无形拘束,而导致的。在这样的生活状态下,其实与坐井观天,并无差异,人的心态,也会变的封闭与孤僻。而我,喜欢自然的生机,喜欢生命的律动,喜欢奇妙的意外,喜欢无法预测的未来,不喜欢…..这个死气沉沉的世界。

“鸿蒙OS的确定时延引擎带来流畅稳定的用户体验,响应时延降低25.7%,时延波动率降低55.6%”,华为的动作很快,宣传也不错,只是…..有些片面。还没有仔细看HM的“确定性时延引擎”到底是什么,猜想,应该是“多任务抢占调用”,那么,任务优先级,以及不同优先级任务单次占用CPU的时长受限,就是很重要的特点,这些,都是RTOS的基础。但是,“响应时延”,一般是指UI线程,而不是后台线程,那么在CPU密集运算的场景下,UI线程优先,就意味着后台线程运行速度会变慢,整体任务运行时间拉长。嗯,设计想法没有错,Windows也这样设计,但是硬件的限制,还是根本的限制,大家还是…..不要盲目相信所谓的宣传吧,要有独立判断,要有逻辑性。至于其他宣传上的片面么,大家自己体会😄

仔细看了看FFN的实现论文,挺有意思的设计。“Flood-Filling Networks (FFNs) are a class of neural networks designed for instance segmentation of complex and large shapes, particularly in volume EM datasets of brain tissue”,图像的处理,一般会用CNN,但是FFN与CNN有很大的不同,它是CNN与RNN的结合,利用了中间结论,改进为最终结论。而且,在实现上,对于EM数据,有很多特定的参数取值,例如基于9x9x20nm的分辨率,设计了以voxel体素为基本单元的region、subvolumn、overlapping等逻辑单元的数值大小,以及CNN的kernel大小,很有针对性。同时,为了解决异常数据,简化主算法训练的时间,保证收敛,FFN也进行了特殊调整,将不同目标划分为不同的子算法,结合使用。虽然,FNN通过这种这种复杂的设计策略,解决了3维建模的精准度要求,但是运行效率,却成为了最大问题,按照论文描述,FFN比CNN要浪费74倍时间,如果……转换为GPU的话,FFN需要的数千GPU,如果用CNN,就只需要几十个了😄。嗯,也许,我们可以事先构建一个基准大脑的神经网络3维模型,虽然构建它,会花费极大的时间,但是针对具体个体使用时,可以作为参照,从而减少时间,这算是一种优化手段吧。至于,通过它来研究神经元的运行机制…..目前的三维模型还不够细化,无法给出connectome连接组学的模型,需要进一步标注😄

Flood-Filling Networks (FFNs) are a class of neural networks designed for instance segmentation of complex and large shapes, particularly in volume EM datasets of brain tissue.

every voxel of the volume was processed by the FFN 59 times in a segmentation run. Ensembling segmentations from multiple seed points further multiplies FFN inference cost by 2.38x, a nd agglomeration introduces another factor of 2.16x. In total, the FFN pipeline required 14.4 x 2 .38 x 2.16 = 74x greater computation compared to the baseline CNN (see Supplementary for details).

训练成本

While the cost function we used to train the network is still based purely on a voxel-wise comparison with the training set, the network can now learn to make use of the fact that certain voxels in its field of view (FoV) have already been classified with high certainty in an earlier iteration.

Classification decisions can be based on, for example, whether those predictions result in a more or less plausible shape for the neural process. Shape information is thus incorporated in as much as it helps the network to improve its ability to predict the boundary map.

It also transforms the problem of single-shot classification into classification conditioned on prior predictions (i.e., classification results from nearby locations) is first i nitialized by seeding a single-voxel in the center of the 49x49x25 voxel training example. A single iteration is then executed and its result is used to update the POM (Fig. 1b). The network weights are then adjusted via stochastic gradient descent using a per-voxel 24 cross-entropy (logistic) loss . This procedure is repeated with the FoV position at a number of locations offset from the center by +/- 8 voxels (72 nm) laterally and +/- 4 voxels (80 nm) in z direction. In order to optimize the training procedure and remain consistent with the inference procedure, a FoV position was used only if the POM value of the new center voxel exceeded 0.9 immediately before the move. The order of moves was randomized. 这个训练很有意思,loss针对每个voxel,而且fov移动是随机的 这样可以训练参数抗噪,防止过拟合

such irregularities are too rare (affecting fewer than one voxel in a hundred) for the network to learn how to avoid them. Rather than enriching them in the training set, we decided to instead detect such irregularities in a separate process.

这也是种平衡 不再从数据角度考虑,不去制造这些异常数据来训练,而是直接检测异常

To address this we trained a separate CNN to detect blood vessel, cell body, neuropil, myelin, or out of bounds voxels and used these classifications to prevent the FFN from extending objects beyond the neuropil.

特殊问题特殊处理,分功能模块,不再一个大系统中处理所有的内容,模块之间定义交互方式,即运算,可以与或非

During training, a snapshot of the network weights (“checkpoint”) was saved every hour. After training was completed, we ran FFN inference over the densely skeletonized subvolume with every available checkpoint, and evaluated the resulting segmentation with skeleton metrics. We selected the checkpoint that had the highest expected run length among the set of checkpoints with the least number of mergers (in our case this corresponded to the set of checkpoints with zero mergers).

这种方法,也是评估的策略,对于训练是否收敛,以及鞍点判断的一种解决方案

Spine出新版本喽!这么多年,创造这个骨骼动画的两个克罗地亚小伙子,还在不断改进版本,发布新功能,对于我们这些购买了Ultimate版本的老用户,坚守承诺,终身升级,赞👍。很多西方企业,在现代经济社会下,注重承诺,有始有终,即使在破产清算时,也会为客户提供数据迁移的解决方案,不会拍屁股走人。知情权,则是他们的另外一个特点。现在访问很多老外的网站时,都会看到有关cookies使用的提示信息,主动告诉访问者,自己的网站,会收集用户的访问记录。嗯,虽然很多时候,我觉得它很烦,因为需要我主动去关闭它,但是,内心里,却喜欢他们这种,对于用户的尊重。人与人之间,是平等的关系,生活如此,商业亦如此

“因为肺结节和糖网存在公开的数据库,且数据库丰富而完整,所以大部分企业都将肺结节和糖网产品作为主要产品”,有名有姓的企业,在同质化竞争,默默无闻的企业,在小而美奔跑😄。腾讯科大优图这样的有钱企业,进入这样的红海市场,虽然无赖,倒也无错,因为他们烧得起钱,也懒得陪医生玩,那就直接用现成的数据,调教好参数后,各种营销手段登台,赚取利润,也赚取名声。其它的创业企业,就不要盲目跟风了

“目前的感知软件是在百度供阿波罗内部使用的,将来希望把它作为云服务开放给第三方的开发者来使”,是的,这会成为一种商业模式。文章还不错,介绍了 self-driving 仿真测试的基本流程和主要技术点,可以一看。不过,对于环境的模拟生成,百度的方案,还存在一个问题,即如何评估模拟环境的多样性,或者说,覆盖率?总是生成类似的环境,是没有意义的,未出现的环境,以及,总是处理出错的环境,才是最重要的。后者可以与自动驾驶软件的执行结果,形成反馈,而前者,则需要算法来评估,因为人力评估,是不现实,也不可靠的。当然,按照自动驾驶业界的惯用提法, “我们满足了99.999….%的情况” 😄,现实中是足够了,但是技术…..要有追求。另外,Normal Map的用处,他们还没有详细提,估计会用在LiDAR的模拟上。嗯,从商业前景上来说,这样的仿真系统,作为SaaS是否合适?与OpenAI的Gym模式,会有什么区别呢?

技术虽然有趣,但是self-driving是否需要呢?驾驶的速度有限,障碍物都在视距范围内,这也就是tesla坚持只用vision解决方案的一个原因。除非,很接近障碍物时,突然其后面有物体出现,导致控制系统来不及反应。正常情况下,人类驾驶,在这种情况下,会事先减慢速度,并密集观察障碍物,随时准备刹车。算法呢?受限于目前的目标识别技术,还无法在高速运动时快速识别物体,那…..干脆识别所有的物体好了,包括障碍物后面的,给算法留出反应时间。这就是所谓简单粗暴的,机器逻辑吧😄

“对话中的大多数问题在两个回合内都有有限的依赖性”,嗯,这就是马尔科夫的体现😄。有些词语翻译的不准确,流畅度也不如第一篇,不过还是推荐一看。比较有趣的地方,是对于 “dataset collection数据集收集” 和 “dataset analyze数据集评估” 的处理上,很有逻辑性,给出了一个比较通用的构建数据集的方法论,以及一些工具,值得借鉴。

“When a person understands a story,he can demonstrate his understanding by answering questions about the story”,definitely,that is what understanding means. 这篇文章是很好的文章,对于NLP自然语言处理领域,做了基本的介绍,推荐一读。其实,我们明显可以发现,目前的NLP技术手段,过于硬了,或者说,过于机械了。在训练数据集的基础上,完全的矩阵参数化处理,根本不想去理解…..什么是语义。这种方法,最大的问题,在于数据集的大小,太难以穷举了,也无法随着语言一起动态进化。所以,我们创造了BERT这样的模型,接着又出现了GPT2这样1.5亿参数的怪物。而且,评估标准,始终是个问题,能不能做到客观化?那么,未来怎么办?能不能无监督学习?google的Transformer模型,虽然有创意,因为它只关心位置信息,看起来简化了实现,但是,依然无语义。我更喜欢 “character embedding字符嵌入” 的设计机制,用CNN来构造特征….. 这个想法,有趣在于,CNN对于信息的抽象,其能力已经在视觉领域得到了验证。那么,如果我们在处理NLP时,不要像现有的方法那样,简单粗暴地关联 “输入单词特征” 与 “输出单词特征” 之间的关系,而是建立多级抽象,也许我们可以获得所谓的语义特征,即使它,依然难以解释。而这,其实也就是一种知识图谱,自动化的知识图谱。而语言理解的机器学习过程,也可以做到不断更新,不断进化

“When a person understands a story,he can demonstrate his understanding by answering questions about the story”,definitely,that is what understanding means. 这篇文章是很好的文章,对于NLP自然语言处理领域,做了基本的介绍。

When a person understands a story, he can demonstrate his understanding by answering questions about the story.

看起来很复杂,其实原理比较简单,因为 “该方法将多轮对话内容连接成一个长序列,并将多轮对话回复选择任务转换为一个句子对的二进制分类(即下一个句子是否是当前对话的回复)任务”,这个是核心设计,即将问题语句,和答复语句,都进行词嵌入处理后,分析问题语句中的词,最有可能对应的答复语句,将语义理解,转化为了一个分类问题😄,虽然有些无赖,但也还算有效。至于里边的数学公式,都是为了将不同维度的数据,关联在一起,而人为设计的映射规则罢了。阿里这种方法,对于合理的人类多轮对话,是有效的,但是对于脑洞大开的无厘头对话,就没有用了😄,可见数据的重要性,gabage in,gabage out,机器学习最原始的教条,过了这么久,依然存在[Sob]

“One Model 模型提升训练效率,优化通信效率提升 AI 的团队协作能力,使用零和奖惩机制让 AI 能最大化团队利益”,这几点,反而是腾讯AI在通往AGI之路上,最大的问题。原因很简单,策略太有目标性了。AI团队的整体目标,就是赢,为此,所有的训练,都在逼着算法,向着这个目标,最优化运行参数,包括独立实体间的通信机制、包括团队间在不同场景下的配合策略。其实,这与人类竞技体育的训练方法,并没有差别,团队在有限场景下的针对性训练,大概率可以找到较优策略,比对手先取得胜利。但这,并不是通用智能,因为现实环境下,任务目标,并不明确,通讯机制,也不及时,个体自己的目标,也与团体不同。那么,人类团体,如何应对这样的AI团体?打破对方通讯的有效性,是很好的手段,离间不同利益群体,也是很好的手段。星爵中人类最终战胜外星机器军团,就用了破环通讯的方法,拜占庭帝国抵御伊斯兰围攻数百年,就用了离间的策略。

“Fuchsia有一套相较于 Android 更为健壮的安全特性,软件内置了加密的用户密钥以加强安全性”,按照目前的信息,google做fuchsia的目标,是跨平台,和win10类似,而java以及linux等法律问题,也是fuchsia想要避免的历史。只是,大家使用fuchsia的动力,会是什么呢?大胆猜想下,加密通信隐私保护、ai边缘增强、联邦学习、模块化设备即插即用,都可能是它原生的特征,那么google对于机器世界的统一管理,也就变的不再遥远

“他们担心这些选项可能不够好,可能很昂贵,而且司机可能会对过于“唠叨”的系统感到厌烦”,絮叨,真的很烦[Scream]。紧急情况下,人从休息状态,切换到接管自动驾驶,不现实。于是DMS换了个思路,让人一直处于接管状态,这…..也不现实。只要能偷懒,人都会偷懒,牛顿第二定律已经意识了这一点,“在没有外力干涉的情况下,物体将维持惯性运动”,而对于人来说,惯性运动……就是休息。因此,可以想象,DMS的絮絮叨叨,“您手离开方向盘了,您眼睛没有看路,您好像打瞌睡了……”,人会喜欢它,才是件奇怪的事情,除了那些,没有办法被迫开车打工的司机外。特斯拉的全自动思维,很根本,它认为机器可以做的,就应该让机器来做,人类不应该随时打断并参与到机器流程中,这会让双方难以配合,因为,人是不可控制的。当年Model3的GigaFactory建造拖那么久,就是因为Musk一直在调试全自动化生产线,而不是让人类参与制造。我喜欢这个思路。未来的人类,生活在机器之上,如何控制机器,反而会变成人类要认真思考的问题。

“拥有一条相对清晰的工业化制作流程,在决定好可以放弃什么,应该保留什么之后,其制作工作奇迹般的提前完成了”,是的,工业化流程,关键点在于规划,分拆成单元,提高透明度,通过小单元的时间可控,来保证整体的时间可控。而这里边,最痛苦的,就是导演和编剧了,因为分拆单元,就是他们的任务,如何分拆更合理,是个平衡,真是…….太痛苦了[Sob],做过架构设计,以及项目管理的人,一定深有同感。不过,他们的流程还是有可改进之处,例如“嘴角改一下需要两周”,这明显是渲染后的阶段,可以提前到预渲染阶段进行调整,会减少一些时间