上海启嘟渡科技商贸有限公司
SEARCH

与我们合作

我们专注提供互联网一站式服务,助力企业品牌宣传多平台多途径导流量。
主营业务:网站建设、移动端微信小程序开发、营销推广、基础网络、品牌形象策划等

您也可通过下列途径与我们取得联系:

微 信: wxyunyingzhe

手 机: 15624122141

邮 箱:

使用AI实现高精度钢琴曲转谱Piano Transcription项目简明使用教程

更新时间:2024-12-30 03:31:55

此项目将钢琴录音自动转录成MIDI文件,精度高,极大提高扒谱效率,AI在音乐转谱领域的应用已崭露头角。GiantMIDI-Piano数据集是由万余首钢琴作品通过计算机转谱技术,自动转为MIDI文件构建而成,其中包括一套名为piano_transcription的高精度转谱系统,该系统将音频文件转为MIDI文件,构建了GiantMIDI-Piano数据库。

转谱系统的特点包括高精度识别,且提供批量转置功能,方便使用。在实际操作中,网友对GiantMIDI-Piano数据集进行了一定的修改,以便更便捷地使用。以下是转置后的一些制作视频。

操作方法简单,只需三步即可完成转置过程。首先,下载包含项目、已训练模型、Python安装包和ffmpeg的资源包,解压后即可使用。此资源包可以在百度网盘获取,提取码为xubj。

在安装环境部分,以64位Windows版本为例,Mac和Linux的步骤类似,需要安装对应系统的软件版本。首先,安装Python 3.7.9版本,确保支持f-string。其次,安装项目所依赖的库、ffmpeg、cuda(仅限NVIDIA显卡用户)、pytorch。具体操作包括安装Python、依赖环境、ffmpeg、cuda(如有必要)和pytorch。

在安装Python后,打开命令行输入python进行测试,确保安装成功。接着,在项目目录根下使用powershell安装依赖库,执行相应的命令。对于ffmpeg的安装,需要将ffmpeg的bin目录添加到环境变量中,确保ffmpeg版本与资源包一致。对于cuda的安装(仅限NVIDIA显卡用户),需更新显卡驱动并安装cuda工具包,注意选择与系统和驱动相匹配的版本。

在安装完所有环境后,即可使用项目进行转置操作。将MP3或wav文件放入input文件夹,可同时处理多个音频文件。通过命令行在piano_transcription目录下运行特定命令,等待程序完成转置过程。如果使用GPU,转置速度较快,大约10秒至1分钟完成一首曲子。转置后的MIDI文件保存在output文件夹中,可使用播放器播放或进一步修改。如需高音质的mp3文件,可以使用Pianoteq音源生成,对效果不满意还可以使用midi编辑软件进行调整。

若使用CPU进行转置,只需在start.py文件中将第19行的cuda改为cpu即可。至此,AI实现的高精度钢琴曲转谱项目便完成了从下载、安装到使用的全过程,大大提高了音乐转谱的效率和准确性。

多重随机标签

猜你喜欢文章

QQ客服 电话咨询