杂想。201906

机器人的感情

交流感情,是一种体验,需要经历。人类的经历,与机器不同,而机器的经历,也与人类不同

人类是否关心机器的经历?机器的发展,是不是就是一种进化过程?这种历史观的经历,人类是否感兴趣?

日志就是目前机器的一种记录,但是,过于流水化,无趣

有趣是什么?

同理心,与人类类似的经历,然后有变化,这是人类愿意看的文学

机器演奏音乐

音乐为什么美丽,人类的生物性,觉得节奏,觉得重复性,是对生存有利,音乐是这种基因记忆的表达

机器如何觉得音乐美丽,机器会觉得噪音美丽,因为机器输入噪音,输出节奏,机器对待他们,就像人类吃饭,输入食物,输出废物,人类觉得食物美好,机器觉得噪音美好

“工厂智能化解决方案需要对接非常多的供应商,包括 WNM系统、库存管理系统、机器人管理系统等”,AGV硬件的非标需求,还相对简单,精度+负载+尺寸+速度,很多时候其实是性价比的问题,客户愿不愿多花一些钱,买更加有冗余的AGV?软件集成,更加麻烦些。硬件可以用模块化解决,软件么,可以用接口解决,但是抽象能力,就要看厂家的本事了

比特币基金(GBTC)

41分钟前 来自资讯

货币的数字化正在进行,而且资产所有权的数字化也在进行,这是一个明显更大的金融市场,具有巨大的全球社会和经济影响  比特币发明10年后,在Facebook的大力推动下,普通市场开始意识到,使用区块链技术的数字货币即将问世。

在幕后,下一个市场已经启动,因为所有主要参与者都清楚,不仅货币的数字化正在进行,而且资产所有权的数字化也在进行,这是一个明显更大的金融市场,具有巨大的全球社会和经济影响。

几周前,我与人共同主持了一个面向伦敦金融城机构投资者和银行家的关于数字证券的封闭式研讨会。我们分为圆桌会议,每个圆桌会议的任务是根据重要性对证券数字化的优势进行评级:增加流动性、效率、成本、交易后的精简、资产价格、部分所有权、速度、全球接入、新金融产品、商业模式等。

当提出结果的时候,显然没有达成共识。每一张桌子都有不同的顺序,而且每张桌子里几乎没有一致的意见。

活动结束后,我与参与者进行了交谈,并意识到房间里的每个人都在考虑一种与自己内心相近的资产类别。一些人在考虑上市股票数字化的评级优势,另一些人在考虑房地产债务,还有一些人在考虑私人股本。

从大局来看,排名并不重要,因为数字化是不可避免的。

证券将走向数字化,因为它们可以。

让我们来解释一下,但首先,这里有一个关于数字化所有权含义的简化说明:

所有权本质上是数据。社会同意所有者X拥有资产Y的权利,并通过法院和警察的权力保护这些权利。与任何数据一样,所有权也可以数字化。

如今,大多数全球资产都是私有的。为了进行交易,买卖双方要经历一个漫长而昂贵的过程,包括律师、会计师等,然后每个人都要签署文件,详细说明买方获得的权利。跨所有所有者的所有文档的组合就是所有权。让我们称这些文档为“模拟所有权”。

公共市场的效率更高——它们拥有所有权的电子记录,但仍不是数字产品。交易需要多个实体跨账本结算每笔交易。这些公共平台价格昂贵,效率低下,启动能力非常有限。

输入安全令牌,一组主文档和智能合约为其定义任何令牌持有者的权利。区块链保存每个令牌所有者的记录,并以协商一致的方式复制,因此没有任何实体控制分类账。

然后,您可以持有您的令牌(您自己或与托管人),或进行交易(使用AI检查每笔交易的法规遵从性)。

所有权本质上变成了一种数字价值,它可以被分解成更小的部分,可以立即在世界各地流动。

数字化的主要特征不是证券以0和1的形式存储(这是“电子的”),而是数字化的证券可以在全球网络上即时流动。

当市场转型时会发生什么?

数字化市场经历了四个阶段。让我们以音乐产业为例:

阶段1:模拟

音乐是用黑胶唱片录制的。你只能买到当地商店的唱片。

等价的所有权:大多数私有事务都是本地的,需要实际的联系。

第二阶段:数码格式

音乐录制在CD上。它现在更加便携,更加电子化,但并不是根本性的改变。

等价所有权:Excel表格,cap表格管理软件…

第三阶段:创新

黑客发现他们可以四处发送音乐文件——地下P2P平台、非法文件共享、拼命保护旧秩序的音乐高管、Napster、法律行动……

同样的所有权:ICOs——就像20年前的音乐共享一样,是开发人员意识到代币的潜力,可以将人们直接连接起来,并改变融资游戏的规则,同样,当局只花了两年时间就进行了反击,并实施了相关规定。

阶段4:数字

在这最后一个阶段,音乐成为真正的数字和市场拥抱新的格式与法律和商业解决方案和新的商业模式在一个快速的网络。像Spotify这样的应用程序出现了,它允许世界上的每个用户想听什么歌就听什么歌(他们不需要购买完整的唱片),只要他们想听。

更好的是,算法和人工智能可以创建组合和个性化的发现列表,新的艺术家可以更快、更便宜地进入市场,这得益于新的商业模式,而在20年前,这种模式会被每一个唱片公司的高管所拒绝。

所有权版本:数字证券。所有权可以流动,就像歌曲一样——想想一个类似于spotily的应用程序,让每个用户都可以访问全球市场上的每一项资产(与他们相关)。

当人们问:“投资者会想要数字证券吗?”答案是:“人们还听歌曲吗?”“一旦所有证券都是数字化的,并且(在监管范围内)可以立即获得,那么一切都与资产有关。格式是即时和透明的。

但随着这一切的发生,一切都发生了变化——可用性、发现、定价和商业模式导致了一个新的流动的数字世界。它会在一夜之间发生吗?

当然不会,有很多障碍需要克服,也有很多解决方案需要找到,但驱动因素是如此强大,数字化实际上是不可避免的。

十亿和万亿之间的差别

音乐市场价值数百亿美元;所有权一般包括数万亿美元。

事实上,“证券”是几十种资产类别的总称,彼此之间差别很大。它们中的每一个通常都比整个音乐市场更大,针对的是完全不同类型的所有者、投资者池和应用程序流。其中一些面向散户,许多主要是机构投资者,通过投资银行和大型交易所进行大规模金融实体交易。

然而,在所有这些资产类别的底部,有一个事实仍然存在:所有权仍然是数据,仍然是关于谁拥有什么权利的问题——现在终于可以数字化了。

@杨寒峰北京 权利数字化,没有问题,但是问题是,资产类别有不同,权利类别也会有不同

我们可以将资产,划分为两类,消费类,和权益类

音乐属于消费类,房屋属于权益类

权益类的资产,物理世界的形态,变化缓慢,导致人们对于这类资源,存在互斥机制。这间房子,我住了,你就不能住了

而人的生命是有限的,权益类的资产,寿命长于个人。那么人死了后,这些权益类资产,怎么办?继承是目前的法律解决机制,如果没有继承人呢?重新分配,也是解决机制

目前的BTC数字货币,想作为权利的证明,但是它存在缺陷,即无法在拥有人不存在的情况下,转移权利

也就是说,这个人死掉了,或者忘记密码了,BTC就丢失了

这种方式,对于权益类资产的重新分配,无法解决

相对来说,EOS会好一些,委员会可以重新指定归属,也就意味着,权利可以被人为裁定转移

从这个角度看,BTC更类似于黄金,甚至文物,是作为一种权益类资产存在,而不是权利凭证

Bitcoin是货币实验,其初衷是质疑法币,质疑主权国家通过发行法币剥削民众的权利。意在手找更优的货币。使民众免于被迫使用法币而被剥削。

区块链技术目前有两个方向,一个是货币,一个是智能合约。

这都是市场经济的结果,权利和义务分散到个人,但是需要获得共识

智能合约,概念上来说,和app没有区别,但是,不需要审核

至于货币,本身就是群体的利益反应,群体内使用相同的货币,群体外需要汇率,保障群体的权益

那么,统一货币有意义么?为了保障自己群体的利益,就会有很多的货币发行,这些数字货币之间,也需要转换

高北十六的榕树原创音乐会,不错的体验。SoulChild乐队的R&B,风格多变,甜孩的摇滚,唱功不错。我更喜欢摇滚,喜欢那激荡磅礴节奏强烈的氛围。在这种现场,难道听钢琴么?嗯,不喜欢所谓正装,不喜欢衬衫入皮带。T血短裤球鞋,自由的心态,年轻的灵魂,探索无限的可能

这篇文章挺有意思,是视觉跟踪技术与光流估计技术的结合,实现手段上,采用了生成网络的技术,特别是VAE变分生成网络,即从自变量x训练到隐变量h,在从隐变量训练得到自变量x,得到完整模型参数,使用时则只使用部分网络层次。只是VAE的分布已定,而它们的方案是构建损失函数,最小化阴影变动方差。概念上来说,实现了SLAM的一个功能,跟踪,但是没有用特征点,也没有用语义,而是光流的变种,增加了鲁棒性,不错。嗯,扩展思考,跟踪过程中的对象,其实,反而可以作为语义数据集的一部分,去掉人工标注。这种自动化的对象标注,完全可以做到实时处理,有很大的应用场景想象空间😄

实现上,目前的汽车需改造一下,油门与刹车之间,增加转换连接杆+电磁控制,发现油门踩到底时,自动触发刹车踏板下行,刹车。

“这种不可复制的数据提出了机器学习算法使用的主要问题; 不同的灾害以不同的方式影响建筑物,建筑结构因国家而异,因此评估中的确定性是确保机器学习算法能够学习有意义模式的必要属性”,赞。翻译的有些歧义,与气象无关,而是建筑物的卫星图片,包括受灾前的图片,和受灾后的图片。简单看了看论文,只有这两个阶段的建筑物图片,缺少……中间更加细分时间段的图片。这可能与特定灾难类型有关,例如龙卷风时,卫星无法看到建筑物的图片,云层阻挡。但是有些类型的灾难,不受这个限制,例如洪水。如果有连续时间段的建筑物图片,我们可以分析建筑物的形变,从而改进建筑物的设计。希望未来的数据,会更加丰富。BTW,国内好像缺少这方面的开放数据集…….

“高度专业化的团队听起来可能是最好的选择,但所有的训练都需要时间和金钱,失去他们将是一个重大的打击。另一种选择是使用可随时抛弃的特工,在必要时牺牲掉他们”,看看残酷的生存竞争,我们就会明白,为什么中国绝大多数小企业,不愿意高薪聘用员工,因为普通员工,可以随时丢弃。而愿意这么做的企业,都需要制定备胎计划,防止重要人员流动。资金的积累,会让这种人才聚集的情况变成壁垒,而企业的自大,会让壁垒从内部破解。小企业的核心,是创始人,他的信仰、追求、待人、做事,会形成企业未来的基因

概要:通过人脸分析和眼动追踪,辅助新手司机安全高效驾驶

问题:新手司机,变道很犹豫,影响自己,也影响他人

方案:针对新手司机,做一个语音提醒,摄像头识别行车道,识别驾驶员对于后视镜的观察。如果发现司机多次观察后视镜,则提示司机,准备变道,自动打开变道灯。变道后,提示司机,加快车速,防止追尾

概要:通过空间计算,辅助驾驶员判断车辆右侧与障碍物的距离

问题:新手司机,很难判断汽车右侧,与周围物体的距离,容易过远或过近

方案:摄像头(手机其实就可以),监视车辆右侧的两个点,后视镜+车头边角。算法,根据后视镜中地面的轨迹,分析车头可能的距离,然后推算右边车头距离障碍物的距离。语音播报,提醒驾驶员实际距离数字。

远光灯对冲

概要:用主动发射光线的方法,惩罚喜欢使用远光灯的司机

问题:夜间开车时,后面总有司机不自觉,喜欢开远光大灯,自己的后视镜和反光镜,十分刺眼

方案:做一个反向大灯,架在车顶,或汽车尾部。做一个摄像头,监控后车灯光。当摄像头发现后车开远光灯时,自动打开反向大灯,闪烁,提示对方关闭远光灯。反向大灯,有长筒套,保证只影响本车道的紧邻后车,不影响其他车道。

器材:大灯1,摄像头1,树莓派1,联线若干,塑料板材一幅。 人员:开发人员写算法,设计师设计外观和布局。

AssBook设计食堂,是我很喜欢的建筑设计栏目,内容有深度有趣味。美好玉田,掐指算来,从去年底时,在万科云设计公社的方案讲解,到如今,完工落地揭幕,真是…..白驹过隙。那么,想象中的设计世界,与现实中的物理世界,碰撞交互后,我们的感受,到底会是什么呢?

这也是有趣的设计思路。实际上,就是传感器封装,直接提供语义输出信号,例如刹车,而不是需要ECU进行数据识别。这种做法,对于自动驾驶来说,会有几种影响。首先,有可能简化中央控制逻辑,因为语义识别已经在传感器设备完成,而中控算法只需要平衡各种语义,输出线控命令即可。然而,也可能让中控算法变得复杂,因为,多个传感器传来的语义信号,可能是矛盾的,意味着算法需要进行校验,不能完全依赖于传感器的语义输出,需要一种机制,自己再次计算一遍,或者用冗余传感器,进行仲裁。最后,对于整车造价来说,可能会增加,单个传感器变复杂了,当OTA升级,有可能并的更简单,可以单个传感器排队升级,不用一次全部升级。挺有趣的设计思路。

一般上说,多传感器紧耦合比松耦合鲁棒性要高很多[呲牙]

一般是这样,但汽车有特殊性,有很多传感器,都要过车规,通过CAN链接,本身就有冗余考虑,因此,更多的意义,在于中控的复杂性被降低了,也就是说,百度的重要性,被降低了,又变成了Tier1的传统玩法

“我们希望这张图,带你走出神秘与未知,步入这千年智慧积累,俯瞰整个数学大厦”,嗯,数学有什么用?古典数学很实用的,微积分解决了复杂的计算需求。近世代数也有用,特别是群论和最小二乘,是机器人控制算法的核心。到了杨-米方程,就属于纯理论啦,对称的美。至于股票预测,就比较荒诞了,数学能不能预测人类之间的博弈?有可能,但是也许只能给出一个平衡解,难以预测每个步骤,因为,哥德尔定理,已经说明,完备的系统并不存在😄

Cerdà为什么要把城市规划成近乎变态的方正形状,倒也不止是为了满足工程师的美感和理性洁癖。他认为只有这样才能从地理上保证每个居民的居住权利。没有社会分级,区域不分好坏,他要求平均每几个街区就要共享一所教堂、学校、市场、墓地、公园以及警察局。公共设施平均分配,既保证每个人都享有使用公共资源的同等权利,又能提高城市运作的效率。这便是Cerdà心目中的理想城市

“他认为只有这样才能从地理上保证每个居民的居住权利。没有社会分级,区域不分好坏,他要求平均每几个街区就要共享一所教堂、学校、市场、墓地、公园以及警察局”,巴塞罗那不止有高迪,还有塞达尔,他对于城市的定义与设计,奠定了巴塞罗那今日棋盘般的建筑布局,而这,皆源于他的理想,改变旧世界,创造平等新世界的,理想。嗯,高迪的建筑风格,总觉得,掺杂了东正教的风格,特别是,富丽堂皇而又繁复无比的装饰,如出一格。巴塞大教堂,我很喜欢它的内部设计,至于外部的圣经故事浮雕,倒觉得一般,这种手法,佛教壁画中,经常出现,也许,是因为见得多了,反而觉得平淡吧。加泰罗尼亚,真是神奇之地…..

“这座教堂从未得到建造许可,尽管它可能永远不会进行礼拜,但当局允许它继续建造,因为它已经成为这座城市的旅游景点”,尘归尘,土归土,信仰,归于个人,而世俗,则属于群体。我们的物理世界,总是在时间的流逝中,趋于混乱,这就是所谓熵增的过程。而信仰,则试图对抗这种趋势,让世界变的结构化,让时间变慢。然而,信仰的传递,随着个体的死去而变的艰难,无以为继时,结构化的世界,也会在时间流逝中,逐渐毁灭。To be or not to be,that is a question

“我没有接受过医学培训,也不具备医疗行业的直接经验。我使用开放 IDC 数据集(预测乳腺癌组织学图像中的 IDC)对原先进行过面部识别训练的分类器进行了训练,并取得了良好的效果”,嗯,未来会怎么发展?在机器自动化流程的大趋势下,是否还需要专业人员?从目前可以看到的技术来看,人类世界的需求,需要有人来告诉机器(在DL中其实就是打标签的😄),机器的运转,需要有人来维护(从现在的打扫地面卫生,变成了清洁PCB,和杀毒😄)。进一步来说,其实机器维护,也可以由机器来做,只是…..人类愿不愿意的问题,毕竟,自组织的系统,可能产生进化,这样会导致,进化后的机器,脱离人类的掌控。因此,人类一定会像病毒一样,牢牢把握着机器进化的方向,就像……数十亿年前,原始病毒,入侵了细胞,变成了线粒体,形成共生关系,然后…..演化为我们今天的人体😄

情绪感知,很难做 目前的做法,看到的,都是通过刺激反应的方式,来判断情绪 但这种方式,需要收集大量数据,获得情绪分析的数据样本 结果呢,会导致,算法给出的结果,是概率意义上的情绪 而不是个体的情绪 个体情绪的分析,不知道有没有更好的方式,我们人类可以知道每个人的情绪,即使对方都在笑,我们也能知道,对方的笑,是不一样的含义 也许,这需要算法进行持续的强化学习吧

“Calibration Tool 对 IR(必须是 FP32)进行数据统计和校准”的过程,嗯,本身也是一个训练的过程,梯度下降😄,只是比较简单罢了。定点数,与浮点数相比,虽然占据内存小,但数值范围也小,因此,是否需要将模型参数转换为定点数,是个典型的Balance考虑,没有标准,就像…..所有的算法设计,都需要考虑适用环境一样,很痛苦[Sob]。但是,自动化的流程,可以简化我们的工作,不止是转换,还包括部署、验证、重新训练、继续下一次转换,反复调整。这种CI/CD的工作平台,好像很少看到,是不是可以搞一个😄?

“我们找到了一些投资人来建立一家中型公司,我们希望创建一种新的体验和新的游戏类型,而不是去做已经存在的事情”,我喜欢他们的Vision,以及故事😄。玩家朋克风,是很有趣的体验,对于像我这样追求新意和冒险的人群来说,很有吸引力。至于他们的玩法设计,特别是Veil Daemon玩法,玩家代表敌人,布置机关陷阱,控制敌人摆位,来与代表人类的玩家对战,倒是我们在《刺客传说》开发中就已经想到的扩展方案,即如何增加联网游戏的对抗性,而不仅仅是组队配合。至于这种设计的效果如何,需要实验。目前大多数玩家接受的组队PK,都是阵营能力对等的方式,如《王者荣耀》,而能力不对等的PK方式,很少见,典型的就是《COC》,可惜逐渐没落。预祝他们的游戏,获得玩家认可👍

千与千寻,终于看了完整的版本。一直以来,我都认为,千与千寻,是小女孩的名字,结果这次才发现,千,是一个名字,千寻,是另一个名字。日本动画中的命名,对于汉语来说,很有想象力,就像电影中的白龙,“赈早见琥珀川,神明一样的名字”。千寻,以及,千,的成长,自然而又坚强。我一直很喜欢日本动画片中的女性,那柔软的身体里,充满着难以想象的力量,一如我的小侄女,晨。她,也是柔软而坚强的,在某次爷爷高处跌倒后流了一地献血时,从开始的痛哭不知所措,到后来打扫地面清理血迹,帮助奶奶照顾爷爷,短短的时间流逝中,女孩,已然长大。宫崎骏,对于人类的理解,真是深刻,以至于,萤火虫挽歌,至今不想再看第二遍[Sob]

“流形上的卷积是一个很有意思的研究方向。这个方向继续发展应该可以大大减少深度神经网络中冗余卷积核(比如说旋转对称的卷积核)的个数”,这也是篇很有趣的文章,通俗来说,就是…..沿着曲面运动时如何对运动轨迹进行分类,就像……在蒙住眼睛的人的手心上,写了几个字,然后让他说出来,写的是什么字😄。其实,关键原因,还是一个视角的问题,如果我们有所有像素的深度信息,那么意味着得到了世界坐标,此时直接通过clustter算法,就能对物体分类,例如K-Means😄。但是,这个要求很多时候无法满足,特别是对于超出人类测量范围的对象,我们只能得到,投射到视网膜上的平面图像,虽然…..我们知道它是三维物体,但是…..没有办法得到Z轴的数值[Sob]。于是,流行的分析,应用而生,而群论,则成了强大的数学工具。这真是人类抽象思维的结晶👍。最近高通的论文,就是这个家伙写的,西方企业对于基础领域的研究,确实值得尊敬

“VAEs现在广泛地用于生成图像,当生成模型训练好了以后,我们就可以用它来生成图像了。与GANs不同的是,我们是知道图像的密度函数的(或者说,是我们设定的)”,嗯,其实,VAE可以看成是GAN的特例,是自己对于自己的对抗,但是方向,即密度函数,已经被指定了。上次有个朋友问大家,除了GAN之外,生成标准手写体的图片时,还有哪些方式?嗯,VAE就是一种方式😄

libra的发行,可以分析一下,对于经济的影响,应该不大,美联储不会紧张的 libra是稳定币,用多种货币作为锚定,看似稳定,但是对商品流动,会造成影响 商品为什么流动,因为价格有高低,从低价区域流向高价区域 如果抹消价格差异,会怎么样?例如,越南的商品,按照越南盾计价,会便宜,但是变成libra计价,可能会变贵,因为它不只含有越南盾,还含有其他法币 这样,消费者的购买意愿,会变弱 但是,所以虚拟物品来说,是好事,例如游戏,和…..洗钱 fb的优势是跨国家的27人,但是对于本地商品流动,并没有优势 美联储不担心,是在于美元本身是信用货币,本身币值就是人为控制的 区块链不重要,只是一种技术,可以看成是分布式数据库和计算 要想一揽子货币起作用,除非这些货币方,是统一市场,没有政治干预 欧元就是很好的例子,欧猪四国,就和德法,经济差异太大,导致欧元并不好用,本地货币反而更好,德国很多人,也希望发行德国的本地货币 信用么,很多时候普通人,并不关心,visa的信用卡不是区块链,大家一样用 fb这点倒是值得借鉴的考量,区块链的引入,是为了平衡100个参与节点方的利益 节点之间,是博弈关系,区块链,是一种避免囚徒困境的解决方案 嗯,就国债来讲,没有什么特里芬难题的😄 二战德国就是例子,战胜国逼迫德国还债太近,导致纳粹上台 二战后,大家普遍认识到这一点,因此有了马歇尔计划,以及日本的麦克阿瑟改造,保留天皇 国债无法兑付时,债权国,没有太多办法 我们自己对于非洲很多国家的国债,也是这样,怎么办?继续展期呗

“所有学术界的成果对Waymo的传感器的兼容性会是最好的,这有助于Waymo轻松吸收最新的科研成果”,好事是好事,但也没有那么重要。学术界的研究,讲究通用性,工业界才喜欢专用。自动驾驶技术的差异,已经不在于数据集了,任何一个做自动驾驶的企业,都会搞到很多数据,而是在于,整体的架构是否合理,融合后的数据是否有高效的决策规划算法来使用,线控算法是否有好的人机体验。这些只靠数据集,难以解决的,反而很多情况下,可以通过仿真完成

“这个算法,模拟了一个网格,每一格包含了一次主震震中周围5公里的范围。告诉神经网络,这里发生了一次主震,并把震中附近应力改变的数据也喂给网络”,这就是DL的作用,归纳,从大量细节数据进行归纳,得出更高抽象程度的结论。而概率,则描述了这种数据到结论的映射规律,可以被重现的范围。我们传统的知识体系,牛顿力学,其实也是这样形成的,伽利略就…..扔铁球+记录测量+拟合数据+描述定理,然后用这个定理,去预测新的环境。在人类地球上,牛顿力学预测成功的概率,接近100%,但是,在太空尺度、在微观尺度,预测成功的概率,发生了很大变化,于是,人们继续归纳,然后,去演绎,去预测新环境😄

“用于搜索神经网络拓扑的操作受到神经进化算法(NEAT)的启发。在NEAT中,拓扑和权重值同时优化,研究人员忽略权重,只进行拓扑搜索操作”,这种简化操作,与忽略拓扑而优化权重的操作相比,好在哪里?并没有看到说明。不过,目前看,只是对于ML的方法的优化,是针对线性回归、决策树、决策森林等其他算法的一种变种,因为,其他算法的训练过程,本质上类似于AWNN对于结构的搜索过程,但是这两种过程,分别耗费时间的长短,并没有看到比较。另一方面,这种算法,也可以看成是Graph网络的优化问题。同时,对于复杂问题的解决能力,也没有看到说明,需要继续探索

我很喜欢这部片子,篮球的魅力,展现无遗。除此外,前苏的问题,也展露无疑。当年解体时,我并不明白原因,所有的文章也语焉不详。后来,随着我们的开放,和阅历的增加,逐渐理解到,放弃,已然是那时的普遍心态。电影中前半部分的描述,很直观,值得体味。前段时间,参加一次技术交流,演讲者偶然问我,佛系,是什么。我答曰,放弃,哲学上的犬儒主义,一种无可奈何下的选择。演讲者有些不知所措,未置可否,转而继续开展他的演讲,创业蝉,创业心态。嗯,现在的年轻人,真的放弃了么?也许,油腻规则下的人和事,让他们看不到未来么?哎,前苏的倒塌,发生在一夜之间,而人们,则冷眼旁观

“结构的学习,由于惩罚值和结构之间缺乏梯度信息交互,所以大部分只能通过搜索来做”,没有办法找到合适的数学方法,却迭代逼近,只好……暴力破解,我们称之为,搜索😄。这个方法需要的时间和空间,太大了,也许,量子计算机,可以上来试试吧[Sob]

一只孤独的……编程猫[CoolGuy],旁边还有……一盒纸巾😱。猫科动物,特别是猫,真是奇怪的物种,到了发情期,母猫会很痛苦,因此,善良而残忍的人类,经常早早地,给猫做了绝育手术[Sob]。不过,自然界这样的进化安排,对猫来说,到底有什么好处呢……

“Corridor Digital”的特效制作水平不错,嗯,Mocap设备也挺贵[Sob]。他们对于特效的制作讲解,倒很详细,整体的流程都有介绍,值得一看。昨天参加了Abi的Pilot的8K全景相机的交流活动,大家就聊过,全景相机,能不能用来玩出更多花样?例如,替换安防相机?例如,同一款原始素材,通过虚拟机位变换,制作不同的剧情和故事?例如,如何增加绿幕特效?嗯,这篇文章倒是给出了一些可行的工程操作实践😄。不过呢,视频其实一看就是假的,主要是机器人的关节,太像人类了。目前关节实现上,都是驱动器连接,持续输出力矩,嗯,很耗费能量,而人类的关节,有膝盖,起到了lock作用,在行走时直立阶段,并不费力,而机器人的关节还不行,所以我们看到的机器人,基本上行走时膝盖都是弯曲的,无法伸直[Sob]

“以视觉为主、多传感融合的感知方案,在研究L3级别自动驾驶方案时考量更多的是用户驾乘体验问题”,这其实,验证了musk的观点,LiDAR和HDMap无用,视觉对于自动驾驶足够了。技术上,传感器融合形成世界模型、决策规划路线、预测对象未来路线,都相对简单,但是平滑的人机体验,倒不全是技术问题,而是产品设计问题。线控目前来说,还没有标准,就算有了标准,走CAN或以太,也只是传数据,不同厂家的线控设备,需要算法适配,才能做到平滑的用户体验,这个是前装的问题,更是后装的大问题。嗯,视频只是视频,并没有演示实际场景拥挤车库的自动泊车,这个更有技术上的挑战。另外,自动驾驶汽车,需要遥控侧方位停车功能,特别是在事故后,交警到场,一定会要求车辆靠边,让开主干道😄

“虽然不同的方法都成功地执行了相应损失“鼓励”的属性,但如果没有监督,似乎无法识别出良好解耦的模型”,其实,所谓监督,本身就是一种训练。第一篇论文很有意思,是指,无法找到统一的超参数模型,也就是说,不同的模型,解决不同的问题,就是需要不同的参数,超参数无法共享。直观上,符合逻辑,直觉上,不符合抽象。也许,这些不同的超参数,本身构成的集合,就可以进一步归纳训练,尝试抽取更高阶的超参数😄。论文简单看了看,没有数学推导,这意味着,还难以像“哥德尔不完备定理”那样,成为划时代的发现[Scowl]。第二篇论文倒也有趣,其实是给出了深度学习训练时的最佳实践,即损失函数很简单时,只要数据集不断增大,很大概率依然可以得到越来越准确的近似解。哎,中文说这些数学概念…….太费劲了,需要好好断句[Scream]。这个消息对于大数据厂家来说,喜笑颜开呀,DL明显就是送给他们的武器,简单粗暴,只要喂数据就好,不需要改进工艺[Sob]。这样看来呢,第一篇文章也有好处,会让这些厂家不要太得意,DL虽然简单,但每个问题都需要重复劳动,累死你们[Chuckle]

和朋友交流,得知这家做教育机器人的公司,上去看了看,发现很有趣的现象。国内的教育企业,大部分的企业经营者,很喜欢…..打扮成领导style,嗯,衬衫要系到皮带里,西裤要盖住皮鞋面😄,哪怕……他们是做儿童教育的企业[Sob]。我很好奇,这种style,能做好教育么?能培育创意么?他们的理想,到底是什么呢…….

研究特定的神经元活动能否影响遗传信息,让后代具备特定的遗传优势,通过这种方式,父母一代可能会在自然选择的背景下传递对后代有益的信息,这可能会影响有机体的进化过程

“Maker Media高估了市场需求,做这块想赚钱还要靠儿童教育”,残酷的成人世界逻辑,孩子的命运被父母所左右,而创客也逐渐成为盈利工具,Maker的世界,已然发展到了这一步[Sob]。14年深圳的MakerFair火爆,18年萧条很多,19年….还不知道。越来越边缘化,深圳很明显,参与者减少,场地减少,创意减少,也没有购买欲望。本来,我还想自己思考下Maker这个事情的商业做法,有没有更好的方式,但是…..想了很久,没有找到答案。个性化的服务,满足少数人的需求,导致了高昂的成本,也带来了无法复制。创客空间?基本上就是二房东吧,附加一些材料和加工便利。元器件平台么,倒是可行的模式,可惜做的人太多了

“它能“看穿”会挡住摄像头视线的东西(这也是目前视觉方案的弊端)”,视觉识别,其实也可以跟踪对象,包括遮挡,但是运算量会变大。雷达对象识别的算法,相对简单很多,CPU运算量小,对点云中的点,使用ML中的Cluster即可获得普遍情况下的目标分割,然后在进行对象检测,可以是3D对象检测,也可以是映射到2D平面后进行传统的视觉对象检测。挺有趣的想法。

“If HERMES is performing a task that requires more conscious effort from the operator, the operator doesn’t also have to keep the robot balanced; an autonomous controller can take over the robot’s balance”,这是很好的设计,就像人体一样,基本的平衡处理,会由脊髓和脑干负责,大脑并不参与,除非,发生了预期之外的意外,例如要摔倒时,大脑才会被触发,并给出操作指令,控制运动神经。MIT的Chetech平台很有趣,开源,也催生了很多有趣的想法,例如深圳的智擎,就基于他们的平台,作出了自己的四足狗,也是定制化的关节驱动器,加大了扭矩,不错👍。沿着这种开源精神,不断去做创新,那么机器,在未来,就会真正成为人类的助手,HUD/ExoSkeleton/RemoteControl,形态各异。哎,可惜现在的价格还是有些高😖。笨笨年纪大了,站立困难,我想给他搞个四足机器狗外骨骼,辅助它行动,还在设计方案,成功后……它会开心很多吧

双向人机界面,实现了操纵者和机器人动作的双向传送

研究人员后来发现对拥有 200 块骨头和 600 多块肌肉的人类身体进行物理跟踪和移动并不是什么简单的事。所以他们决定从更简单的系统开始。

If HERMES is performing a task that requires more conscious effort from the operator, the operator doesn’t also have to keep the robot balanced; an autonomous controller can take over the robot’s balance

“没有伟大的奉献精神”。很早就看到这篇文章,觉得标题党,不太想读。早上照顾完笨笨,累了休息时,才仔细阅读了文章,评论很多,有些意思。自由的精神,确实与文化和传统有关,与地理有关,与科技有关。农业民族,生存的压力,很少会产生自由。航海商业,则需要理性,生存压力,反而导致了需要自由。奉献精神,与目标有关,也与团体规模有关,不能太大,天朝这样的体量和管理,个体难以有奉献意愿。嗯,至于HW,从商业角度考虑,会更加直接。它,非要去做手机么?这与民族何干?如果只是为了赚取商业利润,那完全可以放弃。或者,在赞同华为理念的人群中售卖,也是很好的商业考量。这一点,倒不用区分国内国外,全球人民,喜欢华为这样做事情风格和企业理念的国家和人群,也不少

“ build our maps using only video, GPS, and CAN data”,Vision is enough good for build HD map than LiDAR. 这就是算法的魅力。CAN数据这里的用处,很有趣,可以用于提高HD地图的精确程度。

“其他条件不变的情况下,随着刷题次数的递增,学生从每一遍刷题中所获得的有效知识越来越少”,嗯,所以…….我们决定设计 “Classkull智慧教育”,避免刷题的愚蠢行为,蔑视那些提倡 “自适应学习(刷题)”的企业[Pooh-pooh]

“自动驾驶能够去往任何地方。不依赖高精地图,的确可以做到这一点。而那些使用地图的车只会在有地图的地方正常行驶,即使地图很便宜,他们仍然会被限制有数据的区域内”,这是我喜欢musk的地方,观察问题的角度要root,不要短视,而资本,绝大多数资本,都是短视的。

“深度学习的另一个挑战或限制是长尾问题。在这种情况下,每次罕见的事件都需要大量的数据来理解它或成功地规避”,这个问题,其实是人类自寻烦恼。长尾问题,人类自己都无法保证成功处理,何况机器人?合理的方案是,遇到问题就尝试解决问题,然后总结并调整。对于自动驾驶来说,或者说,深度学习算法,重要的数据是出现问题后的数据,例如无人、尸体、车祸、人群聚集。算法检测到这些对象后,会意识到问题结果出现,然后等待人类干预,并再次训练,防止类似场景重现。这个行为,可以仿真完成。DriveAI还是有独特的技术思考的,感知不用DL,而决策规划用DL,这意味着感知层,可能并不进行对象检测,而是直接喂传感器数据给推理,算是一种……end2end吧。

“黑白照片在抹去材质、色彩的同时,也在一定程度上去除了住宅所在地区的地理人文特征,使得观看者能够更明确地读取照片中住宅与环境的“形状”,从而在“形状”的界面中建立起比较的可能”,嗯,大家现在理解,为什么OpenCV做视觉时,第一步总是要灰度处理了吧[Chuckle]。这篇文章倒是挺有趣,也反应了很多深层次的关联。概念上看,形状和颜色,都是“特征Feature”:一方面,形状特征,反映了人与自然,以及人与人之间的,对抗关系;另一方面,颜色特征,则反映了人与人之间的,合作关系,即文章中所说的“基因”。聚落,则是“聚集Clustter”,这里,是以人与人之间的空间距离,作为划分聚集的标准,算法太简单了😄。但是,如果我们更抽象一下,对人进行编码,不同的编码方案,对应着不同的规则,那么,我们就可以使用这些编码的汉明距离,来做为聚集划分的算法,从而得到不同的clustter😄。例如,身份证号码、护照号码、家谱排行、甚至纹身图案,都是一种编码方案,它将人划分到了不同的clustter中,此时,已经与空间距离,无关了。嗯,一般来说,形状是稳定的,而颜色是易变的,因此自然界的生命,才显得如此顽强,和斑斓

“没有固定的风格,只有持之以恒的因人、因时、因地而变的原则”,我喜欢LaFbrica的办公空间,不喜欢瓦尔登七号,也许是它狭窄的空间和幽暗的环境,令我觉得不适。人的感觉很奇怪,看着建筑,融入周边,心中已然明白,自己的喜好。这就是Style吧,也是Pattern,用数学语言来说,就是拓扑解析几何,我们敏感地发现了,连续形变的几何体中的不变性😄

“It was left to figure out, through trial and error,which movements would produce the desired resultsz” ,嗯,很像猴子写出了莎士比亚😄,太简单粗暴了。如果要提高反应速度, 这里的关键,在于任务分解,分解为多个中间步骤,这一点对于目前的机器学习来说, 太难了。但是,这种中间特征,应该也是可以学习的,例如对于物理世界的理解,除了人类的先验知识直接灌外,还可以尝试对TL迁移学习进行改造,例如,将隐藏层,划分为逻辑上的2个分组,后端的全联接分类层,可以同时接多个目标,前端输入数据也同时接多个,反复训练,也许,第二组隐藏层,可能会产生较为通用的世界概念。更进一步,这一层的参数配置,可以进行聚类clustter学习,从而划分为更加模块化的子模型,组合构成大模型,也就是说,实现了,通用子任务,组合完成,大任务。而这个过程是持续进行的,我觉得不应该归入RL强化学习的范围,而应该是一种,进化学习😄

“感知数据被输入系统,系统识别静态障碍物(如建筑物和树木)、确定移动性障碍物(如足球),以及更具挑战性的非确定性移动障碍物,包括其他汽车、行人和自行车”,这个分类倒是有趣,根据运动轨迹是否可预测,而划分为三类,静止、确定移动、不确定移动。嗯,算是一种优化手段,不确定运动,是最普遍的,例如人类,算法需要不断和人类进行博弈,根据人类的反应,而反应。这很耗费CPU[Sob]。确定性运动,则是指我们可以完全预测其轨迹的对象,牛顿定律,足够了。这种对象,耗费CPU较少,静止对象,则耗费CPU最少。可以发现,RealtimeRobotics的算法,还是在现有MCU能力限制下,不得不做出的优化算法,包括FPGA的采用。问题在于,感知数据,是否能够准确分类对象?分类错误,可能导致算法运行很不平稳,波动较大。不过,想法还是很不错的,划分优先级,分配CPU资源,抓住主要矛盾😄

“在城市环境中,GPS轨迹并不完全准确,因此无法得知平台上车辆的确切位置。Uber工程师将车辆位置概率放入HMM中,维特比算法根据这些轨迹计算出车辆驶过的最可能的路段序列”,这是典型的HMM的模型映射,GPS数据为观测状态,真实位置数据为隐含状态。嗯,由于地图上有道路路段,汽车运动也不会特别快,因此,状态链,不会特别长,而且,文章也提供了分片的方式,来限定链的最大长度,因此HMM算法的计算量,是可控的,可以接受😄。嗯,Uber确实算技术公司,不止在自动驾驶方面,而且在系统运行的其他方面,也始终在尝试,通过技术提高服务质量,而不是依赖人力。这一点,是正确的做法👍,也是伟大公司的味道

隐式马尔科夫链,是传统AI算法中,比较常用的算法,能够解决很多问题,原理很简单,基于概率论,基于贝叶斯定理,然后进行数值比较,得到结果。与DL深度学习相比,HMM属于动态规划算法,更加灵活,但在链很长时,计算量可能比较大,速度会变慢。而DL则通过训练阶段的前置预处理,固化了结构和参数,从而加快了实际应用时推理的时间。嗯,相比而言,RL强化学习,则更加灵活和简单些,HMM需要人为划分隐含状态和观察状态,很多时候,也许难以做到[Sob]

  ・Scoring:给定一个指法,通过打分看它好弹还是不好弹。输入是指法,输出是分数。   ・Matching:给定一个琴谱,给出最好的指法。输入是琴谱,输出是指法。   ・Training:给定琴谱和指法组成的测试用例,通过改变HMM中的参数,来使得这个HMM能“学习”到测试用例中潜藏的规则。

“训练CNN将原始像素从单个前置摄像头直接映射到转向命令”,end2end,看到很多人对它很不屑,觉得它无法解决复杂问题。嗯,我不知道它能不能解决复杂问题,但是对于铺装路面的自动驾驶,应该问题不大,文章证明了这点。直觉上的解释,CNN过滤掉了与转向无关的图像,而只保留了关键的道路边界信息。问题在于,这种过滤方式得到的模型,是有缺陷的。如果,天空,也进入了输入图像,那么可能将天空的特征,也认为与转向有关,而这其实是不符合逻辑的。解决方法,可以有两种。第一种,是输入图像,只考虑图像下半部分,减少天空的影响。第二种,是生成更多的采样数据,这些数据中,将天空以及背景,进行随机变换处理,也会减少天空的影响。嗯,不过视觉,确实可以做很多事情,没有LiDAR后……..太阳照常升起🌞

“使用手套在操作物体时传感器收集到的压力图,可以让机器学习模型学习识别物体、估计物体的重量,以及区分不同的手部姿势”,很好的思路,他们建立数据集的想法,很有意义,为人类制造类手造型的机器人,提供了训练和测试数据。不过,实践上,并不会这么简单。人类的触觉,很复杂,简单来说,表皮/真皮里,就分布了多类传感器,分别感知,变化缓慢的持续压力、变化迅速的压力,皮肤自身的张力等,这样才构成了人类丰富的触觉系统。但是,机器人的触觉系统,是不是要做这么丰富?机器人的抓取结构,是不是一定要像人手?机器人的行走结构,是不是一定要像人脚?如果不需要,那么这些测试数据集,与机器人传感器数据集之间,存在映射关系,需要进行转换。而这种转换的实现,是需要研究的,嗯……可能就是一个玻尔兹曼机😄

过去我们判断互联网会导致世界扁平化和世界大同,但是实际情况正好相反,世界极性加强,族群隔离化更严重。不知道万物互联会进一步加强已有趋势,还是可以扭转这一趋势?

万物互联,会怎么样?有趣的问题。可以借鉴的例子,是生物界的例子 蚂蚁和蜜蜂 它们靠化学激素控制团体,可以认为是一种互联网通信 它们发展出了高度的社会化系统,然后,停滞不前了 从社会组织的角度看,这种社会组织,是不够鲁棒的,非常容易被意外因素,打断整个社会的发展 游戏中的例子是,星际争霸,虫族就是这样,电影中的描述也很多,安德的游戏,命运维系于王者一人 人类么,就更多了,阿兹特克人2万军队,被墨西哥人13骑士干掉,就是实际案例,因为他们抓住了皇帝 嗯,所以呢,要想抵抗意外,就需要个体之间一定的独立性 反叛、对抗、独立、分裂,其实对于族群整体的安全,从基因传承的角度看,会更有利

“他们的方法侧重的是用一种称为幂模运算的更有效的方法来执行数学运算。幂模运算是将数字提高到某个幂然后除以另一个数,找到余数的过程”,这就是数学的魅力。做为基础科学,数学、生物、物理,西方的研究者,人数太多了,看到一个数据,美国每年有2万人申请生物PhD,但是学校只提供2000个教职,那么,无法在学校工作的PhD们,只好去工业界,或者跨界。而这,反而促进了这些领域的研究和发展,因为,理论始终是前进的基础。

Ruiz 干掉了 AJ!Joshua毫无斗志,全场看不到亮点,punch毫无气力,uppercut速度慢,受到combo攻击后忙于招架,真是失望。Ruiz速度很快,战斗意志顽强,冷静而沉着,令人赞叹。回想Tyson的拳风,那种战斗的顽强感……,很难看到这类选手喽[Sob]

“与缩放神经网络的传统方法不同,谷歌的方法使用一组固定的缩放系数统一缩放每个维度”,这是核心思想,也是值得思考和探索的地方。文章翻译的不好,直接看arxiv论文,会理解更准确。简单来说,google总结了一套缩放模型的算法,利用它,可以改进模型,一方面,可以减少存储空间和推理时间,另一方面,可以提高预测准确度。嗯,这套算法,是通用的,可以对任意CNN模型进行优化。而google为了show off,还提出了一个新模型,EfficientNet,然后用数据证明,自己的这个模型,碾压其他模型。这么不给face的操作…..让大家,情何以堪[Sob]。值得思考的地方在于,这其实是AutoML的一种实操,可以看成一种加快搜索的技术,因为它,直接从现有的模型出发,进行优化,而不是无中生有。值得探索的地方在于,论文中的几个缩放参数之间,其实是固定的函数关系,但并没有说明是如何得到的,也许是一种直觉设定。这意味着,可能存在更加有效的缩放参数关系函数。而这个函数关系的搜索,也是一个可以研究的方向😄

“我们这种每日摄入热量只有两千大卡的可怜生物,可以以几千瓦的功率持续输出几个小时,背后支撑我们的是几十亿年来无数生物将游离在空气中的氧化的碳还原后固定在地下所形成的燃料”,这,是赤果果的金字塔呀,好像…..不太符合众生平等的理念[Chuckle]。但是,这其实也很好地表达了一个观点,我们要,保护环境+发展技术,环境是人类生存的基础,不管是花草、还是鸟兽,其实都是自然体系中的元素,是人类维持自身生命运转的外部能量来源,而技术,则是人类如何更加有效率地转换这两种能源的方式。保护了环境,会让外部能量来源,不至于消耗太快,发展了技术,则会让我们在消耗相同的外部能量时,获得更多的人类自身能量。嗯,看起来好像……很自私,但就像《自私的基因》作者提到的,我们公开探讨自私,是为了未来,变得不那么自私😄

我们这种每日摄入热量只有两千大卡的可怜生物,可以以几千瓦的功率持续输出几个小时,背后支撑我们的是几十亿年来无数生物将游离在空气中的氧化的碳还原后固定在地下所形成的燃料

“所有的事情到了硬件层面实际上能用的手段也就有限了。不外乎堆资源和切流水两招。再不然就是做一些bit level的小技巧,比如乘法器变查表之类的。典型的fpga实现,不论是conv,还是pooling,依葫芦画瓢设计data path,切好流水,再想好状态机加上控制信号”,这个家伙,倒也实在,高屋建瓴,然后拼基本功😄。不过,他说的对,设计,在有框架约束的情况下,基本上就是计谋,tricky,微创新。你基于总线的架构设计,数据的传送,还能怎样呢[Sob]。而设计出新的框架,framework,则是伟大的创新,这一点上,我们,比较缺

所有的事情到了硬件层面实际上能用的手段也就有限了。不外乎堆资源和切流水两招。再不然就是做一些bit level的小技巧,比如乘法器变查表之类的。

典型的fpga实现,不论是conv,还是pooling,依葫芦画瓢设计data path,切好流水,再想好状态机加上控制信号