• 相关博文
  • 最新资讯
加载中...
  • AAAI 2020论文解读:商汤科技发布新视频语义分割和光流联合学习算法

    在这篇文章中,作者提出了一个新颖的光流和语义分割联合学习方案。语义分割为光流和遮挡估计提供了更丰富的语义信息,而非遮挡的光流保证了语义分割的像素级别的时序一致性。作者提出的语义分割方案不仅可以利用视频中的所有图像帧,而且在测试阶段不增加额外的计算量。

    2020.02.07 0
  • 时间可以是二维的?基于二维时间图的视频内容片段检测 | AAAI 2020

    当时间从一维走向二维,时序信息处理问题中一种全新的建模思路由此产生。根据这种新思路及其产生的二维时间图概念,微软亚洲研究院提出一种新的解决时间定位问题的通用方法:二维时域邻近网络 2D-TAN,在基于自然语言描述的视频内容定位和视频内人体动作检测两个任务上验证了其有效性,并在 ICCV 2019 中的 HACS Action Localization Challenge 比赛中获得了第一,相关技术细节将发表于 AAAI 2020 论文“Learning 2D Temporal Adjacent Network for Moment Localization with Natural Language”。本文将对这一研究进行深入解读。

    2019.12.23 0
  • 2097352GB地图数据,AI技术酷炫渲染,《微软飞行模拟器》游戏即将上线

    最近,《微软飞行模拟器》最新新的X019版预告视频放出,很多网友都被画面吸引,表示要迫不及待想体验一番。微软也宣布将与多家航空航天企业进行合作,首批宣布的合作伙伴包括空客、波音、CubCrafters、Diamond Aircraft Industries、、ICON Aircraft、Daher、Robin Aircraft、Textron Aviation等。2020年,《微软飞行模拟器》游戏将正式面世。

    2019.11.22 0
  • Hulu视频如何提升推荐多样性?

    本文主要介绍Hulu在NIPS 2018上发表的《Fast Greedy MAP Inference for Determinantal Point Process to Improve Recommendation Diversity》中,提出的DPP算法解决视频推荐中的多样性问题。

    2019.11.14 0
  • 总点第一个视频产生选择偏差?Youtube用“浅塔”来纠正

    本文来自于谷歌研究人员最近发表的一篇论文,介绍了视频平台 Youtube 的视频推荐方法,并在 RecSys 2019 大会上做了分享。本文总结归纳了一些论文中的重点内容。

    2019.11.01 0
  • 网络运行时间提高100倍,Google使用的AI视频理解架构有多强?

    本文作者对自动搜索进行了一系列研究,以寻求更理想的网络架构来进行视频理解。本文展示了三种不同的神经体系结构演化算法:学习层及其模块配置(EvaNet); 学习多流连接(AssembleNet); 和建立计算效率高且紧凑的网络(TinyVideoNet)。本文开发的视频架构在多个公共数据集上的性能明显优于现有的人工制作模型,并证明网络运行时间可提高10倍至100倍。

    2019.10.22 0
  • OpenAI机械手单手轻松解魔方,背靠强化学习+新技术ADR

    10月15日,人工智能研究机构OpenAI发布了一条机械手单手解魔方的视频。这个自学式的类人机器人手臂名为 Dactyl,不仅可以单手解魔方,甚至能在外加各种干扰,比如“蒙眼”,用布娃娃长颈鹿干扰下继续完成任务。这次,这套机械手系统使用的是此前用于 OpenFive 同样的强化学习代码,加上一项名为 Automatic Domain Randomization (ADR,自动化域随机)的新技术,这套系统可以处理之前未见过的场景,再次证明了强化学习的强大学习能力。

    2019.10.18 0
  • 美政府再将8家中国企业列入“黑名单”,海康、科大讯飞、旷视等做出回应

    10月8日,美国商务部发布声明称,美国政府已将8家中国科技企业和20个公安单位列入“实体清单”其中,根据联合早报报道,八家企业包括两家视频监控公司海康威视及大华股份;人工智能公司科大讯飞、旷视科技、商汤科技和依图科技;还包括自称为中国电子数据取证行业龙头企业、网络空间安全及大数据信息化专家的美亚柏科,以及总部位于上海的微米和纳米制造设备供应商溢鑫科创科技。

    2019.10.09 0
  • 北大提出基于人眼视觉特性的沉浸式视频传输系统,改进VR视频体验

    目前,该项研究的学术论文《Pano: Optimizing 360° Video Streaming with a Better Understanding of Quality Perception》已被ACM SIGCOMM 2019接收,是由北京大学计算机研究所的张行功团队和芝加哥大学的江鋆晨团队共同合作完成,并得到阿里、爱奇艺等机构的支持。

    VR
    2019.08.22 0
  • 从音视频技术看AI的机会和挑战

    AI内容理解并不限于生成封面图,精彩剪辑,或者只看某个角色的镜头,这在内容推荐、广告平台有帮助。此外,内容理解还能帮助更好的处理视频,比如可以针对不同的视频内容选择不同的Codec,以及相关的编码工具;也可以找到视频中人眼最关注的部分,分配更多的码率,降低不易察觉的画面的码率,在保证用户体验的前提下降低码率。同时,AI可以把竖版的短视频裁剪成适合横屏播放的内容。

    2019.08.13 0
  • 玩王者荣耀用不好英雄?两阶段算法帮你精准推荐精彩视频

    近日,腾讯三位工程师在arXiv上发表了论文,分析如何利用算法,针对热门手游“王者荣耀”游戏视频进行快速检测与识别,辨识视频中的角色(即“英雄”),以推荐视频给目标受众。为了提取游戏视频标签,需要在游戏视频中检测并识别其中的英雄及其阵营。本文提出了一种有效的两阶段算法,基于血条模板匹配方法检测视频中的所有英雄,再根据阵营分类,然后使用一个或多个深度卷积神经网络识别英雄姓名。实验证明了方法的效率与准确性。

    2019.08.08 0
  • 性能提升3倍的树莓派4,被爆设计缺陷!

    一直以来,素有世界最小电脑之称的 Raspberry Pi(树莓派)是一种独特的存在。它不仅只有一块信用卡般的体积,还具备主机电脑所具备的功能,如运行 Linux、Windows IoT 系统或上网、打游戏、看视频等等。近日,这个极受开发者追捧的树莓派迎来了最新一代的硬件与软件更新。

    2019.07.19 0
  • 旷视推出鼻纹识别,用AI寻找丢失宠物

    基于AI原理,训练出可应用于其他生物识别的算法,或将为市场带来崭新的生机。例如,构建机器学习算法来自动识别图片或视频素材中的动物特征,从而实现对动物身份的识别。目前,作为生物识别之一的猪脸识别已经被应用于养殖、食品等行业,许多公司也纷纷对其他类型的动物识别做出尝试。近日,旷视科技就推出了鼻纹识别技术,用 AI 来帮助人们寻找都是的宠物。

    2019.07.12 0
  • 一览微软在机器阅读理解、推荐系统、人机对话等最新研究进展 | ACL 2019

    ACL 2019将于7月28日至8月2日在意大利佛罗伦萨举行。在本届大会的录取论文中,共有25篇来自微软亚洲研究院和微软(亚洲)互联网工程院。内容涵盖文本摘要、机器阅读理解、推荐系统、视频理解、语义解析、机器翻译、人机对话等多个热门领域。本文将为大家介绍来自不同领域中有代表性的8篇论文。

  • “篡改”视频脚本,让特朗普轻松“变脸”?AI Deepfake再升级

    在最新的深度技术突破中,研究人员展示了一种新方法,该方法使用机器学习技术让用户编辑视频文本内容,来添加、删除或更改视频人物中的话语。

    2019.06.12 0
  • 技术引路:机器学习仍大有可为,但方向在哪里?

    阿里巴巴达摩院、腾讯音视频实验室、Hulu 研究院、腾讯优图、滴滴、微博一线技术专家带来的机器学习技术风暴。

    2019.05.27 0
  • 《使女的故事》大火,AI是背后最大推手?

    还记得大火的美剧《使女的故事》吗?先别着急回答,这次我们不讲剧情,而要说的是这部剧背后的发行方是美国 Hulu 网站。该网站是美国第二大付费在线视频平台,以提供电影电视点播服务和电视直播服务为主。截止今年 4 月底,它在美国已拥有近 2900 万付费用户。

    2019.05.24 0
  • 脑洞大开!机器学习与AI突破(附链接)

    本文介绍了近期在机器学习/人工智能领域一些非常有创意的突破,每一个都脑洞大开,不管是否是相关从业人员都值得一读。并附上一些论文、视频链接和简要总结。

  • 东大漆桂林、清华李涓子、复旦肖仰华等大牛确认出席CTA峰会!5月一起打卡杭州

    CTA峰会嘉宾揭秘!东南大学漆桂林、清华李涓子、复旦大学肖仰华、腾讯音视频实验室负责人刘杉、Hulu北京首席研究主管谢晓辉等齐聚杭州,共话机器学习与知识图谱的技术研究与落地应用。

每页显示 共28条数据 < 1 2 >      到第 GO