投稿指南
一、本刊要求作者有严谨的学风和朴实的文风,提倡互相尊重和自由讨论。凡采用他人学说,必须加注说明。 二、不要超过10000字为宜,精粹的短篇,尤为欢迎。 三、请作者将稿件(用WORD格式)发送到下面给出的征文信箱中。 四、凡来稿请作者自留底稿,恕不退稿。 五、为规范排版,请作者在上传修改稿时严格按以下要求: 1.论文要求有题名、摘要、关键词、作者姓名、作者工作单位(名称,省市邮编)等内容一份。 2.基金项目和作者简介按下列格式: 基金项目:项目名称(编号) 作者简介:姓名(出生年-),性别,民族(汉族可省略),籍贯,职称,学位,研究方向。 3.文章一般有引言部分和正文部分,正文部分用阿拉伯数字分级编号法,一般用两级。插图下方应注明图序和图名。表格应采用三线表,表格上方应注明表序和表名。 4.参考文献列出的一般应限于作者直接阅读过的、最主要的、发表在正式出版物上的文献。其他相关注释可用脚注在当页标注。参考文献的著录应执行国家标准GB7714-87的规定,采用顺序编码制。

黑科技!18+ 开源 AI 工具箱

来源:工具技术 【在线投稿】 栏目:综合新闻 时间:2022-08-16 22:54
作者:网站采编
关键词:
摘要:不过作者也说了,因技术限制,目前只适合矩形图片转换,照片最好要清晰。抓换后的漫画可以采用超分辨工具进行二次优化。 对于一些有纪念价值的老旧照片,如果损坏的话想要修复

不过作者也说了,因技术限制,目前只适合矩形图片转换,照片最好要清晰。抓换后的漫画可以采用超分辨工具进行二次优化。

对于一些有纪念价值的老旧照片,如果损坏的话想要修复比较麻烦,现在用 AI 技术可以自动对丢失的细节进行自动绘制。据介绍,这个项目采用的是 GFPGAN 腾讯开源的人脸修复算法,它利用预先训练好的面部 GAN(中封装的丰富和多样的先验因素进行盲脸修复。

以上这些工具都是基于开源的 AI 项目制作成 GUI 界面版本,方便大家使用了。所有依赖和模型都是内嵌的,所有打包输出的桌面APP都是可以开箱即用。

AI目标检测可以识别视频/图片里面的一些东西,采用 Yolo 目标算法,支持的检测比如物体检测、口罩检测、车牌检测、车辆检测、苹果质量等级检测等等。

因为是使用了第三方接口,微软语音、火山语音、阿里云语音需要一定的付费,免费的有限制,作者也提供了免费的使用,你也可以自己去申请相关的 APPID 和 Token 密钥。

不过目前这个模型算法的抠图效果并不太好,对于比较复杂背景图片,例如毛发,识别抠出来的效果比较一般了。

另外「Paper2GUI」项目都是独立软件,并不是整合在一起,你可以根据你的需求来选择性下载。

图片抠图没什么难度,但是手动对视频抠图就比较麻烦了,现在借助 AI 智能算法 RVM、MODNet、MobileNetV2 等可以自动抠出图片。使用也很简单,导入视频后点击开始按钮处理即可。

AI视频补帧帧率方面支持选择 60、90、120、240、360,转换的时间根据你电脑的性能了,默认使用 GPU 加速处理,较高要求 4K/60FPS 如果需要多显卡支持,作者表示未来会考虑加入多显卡支持。

需要注意的是,因为是采用 GPU 加速,所以同样你需要一个给力的显卡。输出的效果支持绿幕背景,方便你导入视频编辑软件进一步合成处理。

对于一些老旧视频、电影想要转换成高分辨率在以前是靠人工逐帧修复,成本非常高,修复的时间也很长,据说每人每天可能只能修复二三十秒,修复一部电影甚至需要两三年的时间。

随着人工智能 AI 技术的发展,现在也越来越多的软件采用了 AI 技术,例如之前锋哥给大家分享过的清华大学的一些 AI 工具,包括有反向辞典、文字校对、据意查句、一键生成诗词等。同时还有视频补帧、智能抠图、语音合成、人像修复、去除马赛克等流行的 AI 项目。

作者:下1个好软件

而现在可以用 AI 来自动超分辨率放大,支持把视频放大2倍、3倍、4倍,甚至优化画质。AI视频超分辨放大目前提供了四种超分模型,分别是 RealCugan、RealESRGAN、RealSR、waifu2x,不同算法对不同的图像效果不一样,例如动漫类的可以优先考虑用 waifu2x 。

如果你对这些 AI 项目感兴趣的话,今天锋哥要给大家分享这个「Paper2GUI」免费的 AI 桌面 APP 工具箱,根据作者介绍已支持 18+ AI模型,内容涵盖语音合成、视频补帧、视频超分、目标检测、图片风格化、OCR识别等领域。支持Windows、Mac、Linux系统,未来还将适配安卓和苹果设备,另外还有小程序。

最后就是这个项目作者还在继续开发中,目前一些 AI 项目使用的效果未必很好,感兴趣的可以继续关注后续的更新吧。

AI 语音合成适用于配音、讲解、说书等场景,相比传统 TTS 有着特殊优势:有呼吸声、万千音色、自然流畅、媲美真人。

目前提供了三种语音合成,分别是微软语音、火山语音、阿里云语音,操作简单、支持音效试听、支持无限多开、中文语音丰富、自带呼吸声,效果逼真。

目前一般来说视频的帧数在 30FPS 左右,加上拍摄视频为了节省成本,几乎大多数电影都是 24 帧拍摄的。现在 30FPS 的影片已经开始满足不了一些人的观感了,例如我们玩游戏通常需要到 60 帧才会发现画面是流畅的。所以可以借助 AI 软件来实现插帧。

AI视频补帧提供了 Dian-GUI 和 RIFE-GUI 两个版本,根据作者推荐用 RIFE-GUI 版本,无需繁琐设置,零依赖,开箱即用的一款视频补帧工具,经过智能补帧算法,可实现丝滑流畅画质。

文章来源:《工具技术》 网址: http://www.gongjujishu.cn/zonghexinwen/2022/0816/682.html



上一篇:美国对EDA工具等四项技术实行新出口管制
下一篇:美国再对先进技术实行出口管制 国产替代迫在眉

工具技术投稿 | 工具技术编辑部| 工具技术版面费 | 工具技术论文发表 | 工具技术最新目录
Copyright © 2021 《工具技术》杂志社 版权所有 Power by DedeCms
投稿电话: 投稿邮箱: