Advertisement
Vocaloid2.png

VOCALOID2 (часто обозначается «V2») — программное обеспечение для синтеза вокала, разработанное YAMAHA Corporation. Является преемником оригинального VOCALOID выпуска 2004 года.

История

Когда началась разработка VOCALOID2 произошло несколько изменений касательно принципа синтеза вокала, поскольку вместо того, чтобы использовать семплы, записанные в качестве аналитических данных, чтобы адаптировать результаты работы движка под вокалиста, было принято решение о базировании вокала на основе семплов человеческого голоса с соответствием движка им, дабы достичь более плавных результатов. Вместе с эти был переработан интерфейс. В 2004 году был протестирован первый прототип движка, результат работы которого был опубликован в 2015 году в лице песни «Young Blood», в которой использовался неизвестный тестовый японоязычный голосовой банк.[1]

Полноценный анонс VOCALOID2 произошёл 27 января 2007 года. Чуть ранее, 18-20 января того же года на выставке NAMM были продемонстрированы три голосовых банка для VOCALOID2. Имена двух из них, а именно Sweet ANN и Prima были раскрыты в феврале и мае 2007 года. Третий голосовой банк, коим оказался BIG AL, был полноценно анонсирован позже всё в том же 2007 году. 29 июня 2007 года состоялся релиз движка, в этот раз без публичного бета-тестирования

В отличии от предшественника, VOCALOID2 быстро завоевал популярность на своей родине, поскольку один только голосовой банк Hatsune Miku с одних лишь предзаказов продался тиражом более, чем 3000 копий, что привело к созданию многих дополнительных голосовых банков как, а также привлекло к сотрудничеству новые японские компании. Англоязычные же вокалоиды, направленные в первую очередь на зарубежную аудиторию, завоёвывали популярность гораздо медленнее, хотя и добились гораздо большего, чем их предшественники из первого поколения.

Поскольку подход к движку у разных компаний отличался, качество голосовых банков, в особенности японоязычных, качество и реалистичность голосовых банков росло со временем. К примеру, Hatsune Miku и Kagamine Rin/Len от Crypton Future Media, Inc. и не пытались звучать реалистично, в то время, как более поздние голосовые банки вроде Megpoid и Gackpoid от Internet Co., Ltd., в связи с соответствующим виденьем компании, звучали более реалисично. Тем не менее, наиболее серьёзные изменения были внедрены Bplats, Inc. с их VY-серией, где впервые была в запатентована функция слабого дыхания (VY2) и произошли изменения в организации библиотеки (VY1).

Первые идеи VOCALOID API были использованы в данном поколении, хотя и не всегда анонсировались. VOCALOID2 был портирован на IOS, где получил название iVOCALOID и VocaloWitter для iPhone и iPad соответственно. В 2013 году на движок VOCALOID2 были перенесены голосовые банки AZUKI И MATCHA, чьи персонажи являлись частью франшизы Project 575, чей взлом произошёл в том же году, в результате чего стало стало известно о разработке урезанных версий голосовых банков, однако в итоге VOCALOID2 не получил поддержку Lite-версий и их нельзя было распознать вплоть до выпуска VOCALOID3.

В 2010 году была выпущена локализация интерфейса на традиционный китайский язык, доступный на тот момент только для голосового банка SONiKA, с которым он продавался на территории Тайваня. Кроме того, с выпуском новых партий более поздних голосовых банков, у VOCALOID2 обновлялся движок, что заставляло адаптировать более старые голосовые банки под новую версию, хотя не все производители были за этим замечены.

Последней версией VOCALOID2 стала 2.0.12, выпущенная 6 ноября 2010 года.[2] В конце 2011 года, в связи с выпуском VOCALOID3, поддержка программного обеспечения предыдущего поколения была прекращена. В конце 2015 года было объявлено о скором прекращении серийных номеров для VOCALOID2, что означало дальнейшую невозможность легально использовать ПО. По итогу, днём окончательной смерти движка стало 31 марта 2016 года.

Системные требования

Характеристика Минимальные требования Рекомендуемые требования
Операционная система 32-битная Windows XP/Vista 32-битная Windows XP/Vista[3]
Процессор Pentium 4 на тактовой частоте 2 ГГц или Athlon XP 2000 Pentium 4 на тактовой частоте 2 ГГц или Athlon XP 2000
Оперативная память От 512 МБ
Место на жёстком диске От 4 ГБ От 4 ГБ

Голосовые банки

Коммерческие релизы

Название Дата выхода Язык Гендерная принадлежность Компания
Sweet ANN 29 июня 2007

21 сентября 2007 (Япония)

Английский Женский PowerFX Systems AB.
Hatsune Miku 31 августа 2007 Японский Женский Crypton Future Media, Inc.
Kagamine Rin/Len 27 декабря 2007 года Японский Женский и Мужской Crypton Future Media, Inc.
Prima 14 января 2008

22 февраля 2008(Япония)

Английский Женский Zero-G Limited
Kagamine Rin/Len act2 18 июля 2008 Японский Женский и Мужской Crypton Future Media, Inc.
Gackpoid 31 июля 2008 Японский Мужской Internet Co., Ltd
Megurine Luka 30 января 2009 Английский и Японский Женский Crypton Future Media, Inc.
Megpoid 26 июня 2009 Японский Женский Internet Co., Ltd
SONiKA 14 июля 2009
15 июля 2009 (Япония)
7 августа 2009 (Тайвань)
Английский Женский Zero-G Limited
SF-A2 miki 4 декабря 2009 Японский Женский AH-Software Co. Ltd.
Kaai Yuki 4 декабря 2009 Японский Женский AH-Software Co. Ltd.
Hiyama Kiyoteru 4 декабря 2009 Японский Мужской AH-Software Co. Ltd.
BIG AL 22 декабря 2009
5 марта 2010 (Япония)
Английский Мужской PowerFX Systems AB.
Hatsune Miku Append 30 апреля 2010 Японский Женский Crypton Future Media, Inc.
Tonio 14 июля 2010 Английский Мужской Zero-G Limited
Lily 25 августа 2010 Японский Женский Internet Co., Ltd
VY1 1 сентября 2010 Японский Женский Bplats, Inc.
Gachapoid 8 октября 2010 Японский Мужской Internet Co., Ltd
Nekomura Iroha 22 октября 2010 Японский Женский AH-Software Co. Ltd.
Utatane Piko 8 декабря 2010 Японский Мужской Ki/oon Music Inc.

Sony Music Entertainment Japan (дистрибуция)

Kagamine Rin/Len Append 27 декабря 2010 Японский Женский и Мужской Crypton Future Media, Inc.
VY2 25 апреля 2011 Японский Мужской Bplats, Inc.

Некоммерческие релизы

Название Дата выхода Язык Гендерная принадлежность Компания
AZUKI 26 июля 2013 Японский Женский SEGA
MATCHA 26 июля 2013 Японский Женский SEGA

Описание

Характеристики

VOCALOID2 — переработанная и улучшенная версия VOCALOID, отличающаяся от оригинала во многих аспектах.

Прежде всего, был изменён подход к созданию голосовых банков, поскольку, как уже говорилось ранее, теперь вместо анализа человеческого голоса вокал стал базироваться на отдельных звуковых образцах, что позволило сделать результаты более плавными. Был изменён формат файла: теперь вместо "VOCALOID midi" файлы имеют формат .VSQ, что позволило сохранять больше данных, специфичных для VOCALOID. У VOCALOID2 есть возможность импорта в него любого файла, связанного с midi, однако его поддержка является ограниченной. V2 не может сохранять файл в формате midi, однако может экспортировать в него Файлы .VSQ, что, однако, может привести к потере данных, уникальных для VOCALOID2. Кроме того, VOCALOID2 имеет одностороннюю совместимость с UTAU, поскольку .VSQ могут быть импортированы в него, после чего преобразованы в .ust, однако преобразование с .ust в .VSQ с дальнейшим использованием в VOCALOID2 уже невозможно.

Был изменён метод создания звука дыхания. Если в оригинале для этого использовался [*in], то теперь оно создаётся вводом от [br1] до [br5], в зависимости от того, какой из из пяти семплов вы хотите использовать, а также были удалены возможности выдоха, что ранее осуществлялись с помощью [*out]. Также были добавлены [Sil] и [Asp], что в значительной мере увеличивают возможности программы в зависимости от места использования. Кроме того, VOCALOID2 имеет несколько скрытых фонем, что не упоминаются в справочном руководстве программы. Существует "vowel-to-vowel" преобразование, записываемое как [-], которое плавно переносит слово через несколько нот.

Как уже было сказано ранее, изменения коснулись и интерфейса программы, что был полностью переработан и также стал более усреднённым для всех голосовых банков, в то время, как оригинальный VOCALOID имел уникальный интерфейс для каждого голосового банка. Также была изменена и локализация, поскольку теперь японские войсбанки имеют интерфейс на японском или традиционном китайском (только специальные версии, поступившие в официальную продажу на территории Тайваня) языке.

Улучшения

Одним из значительных улучшений являются различные улучшения произношения. К примеру, слово "Now", синтезированное с помощью англоязычных голосовых банков второго поколения, звучит более гладко, в то время, как VOCALOID разбивает его и звучит как "No-ow".

VOCALOID2 имеет более реалистичный человеческий тон, чем VOCALOID. Большинство вокалов звучат намного резче, чем вокалы прошлого поколения, и, в целом, итоговые результаты звучат гораздо чище. Была доработана синхронизация вокала с минусовкой, а также нескольких вокалов друг с другом.

Многие улучшения движка были привнесены не сразу, а лишь после обновлений, потому голосовые банки, выпущенные ближе к 2011 году, звучат более плавно, чем выпущенные в 2007-2009 годах, что особенно заметно в VY1 и VY2, во время разработки которых были внесены значительные улучшения в работе движка, хотя ядро и осталось прежним, что в итоге породило проблему сильно разброса в качестве вокала у разных голосовых банков на VOCALOID2.

Известные проблемы

Помимо уже упомянутого разброса в качестве у разных банков, у VOCALOID2 имелись и другие проблемы. Так, например, у V2 были урезаны возможности изменения вокала, позволяющие добиться более разнообразных голосов. Вокал в VOCALOID2 в целом был более плоским, чем собственный вокал голосовых доноров, хотя иногда и удавалось сделать его немного глубже, что, впрочем, было не так заметно, как у VOCALOID. Несмотря на улучшения синхронизации вокала и инструментария, а также вокалов друг с другом, у некоторых голосовых банков, как например Utatane Piko, всё ещё отмечаются проблемы с синхронизацией. Также в VOCALOID2 наложены ограничения на настраивание вокала на басовые диапазоны.[4]

Хотя ПО и могло работать как с английский, так и японским интерфейсом, переключать их вручную было нельзя, что стало вызывать проблемы, когда начал появляться спрос на японоязычные банки у англоговорящей аудитории и наоборот. Особенно остро данная проблема стала стоять после появления в продаже Megurine Luka, который, как билингварный голосовой банк, привлёк значительное внимание как и англо, так и японоязычной аудитории, однако не имел английского интерфейса. Единственным способом настойки языка была модификация программы путём изменения файлов, а именно удаление и добавление специальных файлов в формате .dll, чьё присутствие отвечало за использование японского языка для интерфейса.

Некоторые голосовые банки конфликтовали между собой, если были установлены поверх более новой версии движка, из-за чего порой редактор просто отказывался запускаться, что было решено в более поздних версиях.

Хоть с VOCALOID2 и была проведена работа с целью улучшения произношения, нечёткое звучание всё ещё оставалось проблемой для большого числа вокалоидов. В особенности это касалось англоязычных голосовых банков, поскольку у них необходимо было обрабатывать больший массив сэмплов. Существует также проблема потери ясности и-за плохой обработки образцов вокала, хотя импровизированный цифровой шум, не является основной причиной потери вокальных результатов и больше влияет на качество сэмплов и тон синтезируемого вокала. Некоторые вокалоиды также страдают от нескольких заметных ошибок, как например то, что в конце звучания определённых сэмплов создаётся "щёлкающий" звук. Проблема актуальна как для англоязычных, так и для японоязычных банков, однако частота их появления зависит от используемого банка, что особенно хорошо видно при сравнении SONiKA, где звук проявляется чаще, и BIG AL, при использовании которого данная проблема всплывает очень редко.

В программе есть данные о дифонах, данные трифонов по-прежнему отсутствует, благодаря чему некоторые звуки трудно отличить друг от друга и требуется дополнительная работа, дабы звуки начали звучать более уникально.

Помимо всего прочего, ранние версии VOCALOID2 имеют проблемы с работоспособностью на 64-разрядных версий операционных систем, начиная с Windows 7. В 2009 году данная проблема была решена и все последующие версии стабильно функционируют на новых 64-битных системах.

Продвижение

С 2007 по 2009 год рекламной компании, не считая тематических статей в журнале DTM MAGAZINE, как таковой у VOCALOID2 практически не было. Согласно официальным заявлениям, прогнозы YAMAHA Corporation были таковы, что голосовые банки второго поколения, при самом оптимистичном сценарии развития, будут иметь средний уровень продаж на уровне MEIKO (3000 проданных копий за первый год), посему было принято решение продолжать использовать пиар-ходы, хорошо показавшие себя при продвижении продуктов оригинального VOCALOID. После триумфа Hatsune Miku и успеха других голосовых банков Crypton Future Media планы были скорректированы и в 2009 году началась продажа официальных руководств по программе в виде журналов и книг. Как уже было сказано ранее, большую роль в популяризации VOCALOID2 сыграла популярность вокалоидов Crypton Future Media и в особенности Hatsune Miku, что на долгое время стала лицом VOCALOID в целом.

Как стало понятно из предыдущего абзаца, важную роль в продвижении отдельных голосовых банков и VOCALOID2 в целом сыграло сарафанное радио. Помимо обсуждения в Интернете и передачи там же тематического контента друг другу, фанаты также занимались продвижением и офлайн, ярким примером чего является фанатский конвент "The Voc@loid M@ster", проводившийся четыре раза в год в Токио и префектуре Канагава, призванный объединять продюсеров, композиторов и иллюстраторов. Впервые мероприятие было проведено в 2007 году и в нём приняло участие 48 групп, однако впоследствии мероприятие стало популярнее и к 14 разу участие взяли более 500 групп, к которым присоединились и официальные представители компаний, занимающихся изготовлением и выпуском голосовых банков.[5] Позже, в 2011 году, YAMAHA Corporation начали проводить официальные мероприятия подобного рода, как например VocaFes 2011 и Vocafarre.

Отдельные компании имели разный подход и разную по масштабности пиар-компанию. Наиболее глобальной она была у Crypton Future Media, что после триумфа их вокалоидов стали выпускать различную атрибутику с персонажами, видеоигры, а также устраивать живые концерты с применением технологии псевдотрёхмерной графики. Также 29 ноября 2010 года Crypton начал независимую музыкальную публикацию для получения гонорара за авторские права, если песни используются в коммерческих целях, таких как караоке, потому что пользователи VOCALOID почти не использовали коллективное авторское право Японского общества прав авторов, композиторов и издателей.[6] Подобный подход имели и Internet Co., Ltd , выпускавшие тематические товары, а также использовавшие образы и голоса GUMI и Camui Gackpo на массовых мероприятиях вроде King Run Anison Red and White в 2010 году. Bplats, Inc. же проводили более мелкие рекламные акции для своих VY1 и VY2, однако они по прежнему не использовали маскотов, а также имели направленность на профессиональных продюсеров, нежели на массового любителя, что также заключалось и в акцентировании внимания на качестве продукта, нежели на его имидже. Sony Entertainment Japan же, помимо демонстрации Utatane Piko, не приложила особых усилий для продвижения товара своими силами, а также частично перекрывала возможность распространения с помощью сарафанного радио, запретив публикацию песен и каверов, сделанных с помощью демо-версии банка.

В то время как японские компании уже имели внушительную фанатскую базу, PowerFX Systems AB. и Zero-G Limited традиционно оставались хорошо замеченными лишь в кругу профессиональных продюсеров, из-за чего компаниям пришлось наращивать фандом вокруг своих вокалоидов практически с нуля. С этой целью была налажена прочная связь с фанатским сообществом, а также стала уделяться большее внимание их отзывам и пожеланиям. Крупнейшей точкой для получения связи с фанатами, с течением времени, в итоге стал форум VOCALOID Otaku. Тем не менее, такая тактика не всегда давала свои плоды да и в целом англоязычный рынок был куда более ограниченный, чем японоязычный.

В 2010 году Crypton Future Media начали продвижение своих вокалоидов в англоязычной среде, что породило несколько крупных рекламных ходов. К примеру, изображение Мику было нанесено на Toyota Corolla во время забега в 2011 году.[7] Также Хацунэ Мику выступила на собственном концерте в Лос-Анджелесе 26 мая 2011 год, билеты на который были полностью распроданы. Кроме того, началась официальная продажа тематических товаров для англоязычной аудитории. Таким образом, Crypton Future Media использовала те же ходы, что и в случае с японоязычной аудиторией, а также сохранила своё табу на использование образов вокалоидов в политической пропаганде.[8]

Культурное влияние

Поскольку продвижение VOCALOID2, также как и оригинального VOCALOID, планировалось через DTM MAGAZINE, на старте нового поколения аудитория, в большинстве своём, состояла из профессиональных и любительских продюсеров мужского пола, что вытекало из преобладающего контингента среди читателей журнала. По этой причине, а также учитывая опыт KAITO и MEIKO, Crypton Future Media было принято решение сконцентрироваться на выпуске новых женских голосовых банков с маскотами идентичного пола.

В конечном итоге данные решения действительно помогли в привлечении внимания, однако помимо них в силу вступили и другие неожиданные факторы. Одним из наиболее значимых Crypton Future Media было признано вирусное распространение информации в Интернете, где крупную роль сыграли мемы, привлекающие к проекту новую аудиторию. Наиболее известным и крупным примером принято считать видео с Hachune Miku, являющееся вариацией мема Loituma Girl, чья популярность на японских, а в последствии и зарубежных, ресурсах привлекла к Hatsune Miku, а через неё и к вокалоидам в целом, больше внимания, а также показала, что VOCALOID можно использовать для большего, чем только полноценные музыкальные работы от профессионалов.[9]

С течением времени интернет-ресурсы стали иметь всё больше влияния на продвижение товаров в массы. Одной из важнейших площадок, используемых для этих целей, стал видеохостинг NicoNico Douga, к коему ближе к середине второго поколения присоединился и YouTube,что позволяли свободно публиковать своё независимое творчество разного типа, начиная от песен и ремиксов, заканчивая фанатскими анимациями, тем самым продвигая ПО дальше.[10] В конечном итоге это привело к тому, что разработчики и дистрибьютеры начали публиковать демонстрационные песни, призванные продемонстрировать возможности программного обеспечения, а также позволило найти людей для работы над новыми продуктами, ярким примером чего является Кентаро Миура, предложивший свои услуги бесплатно из-за своей любви в вебсайту и по итогу ставший автором внешнего вида Camui Gackpo.[11]

В сентябре 2009 года три фигурки Hachune Miku были запущены в ракете в пустыне Блэк-Рок в штате Невада, однако они так и не смогли достичь открытого космоса.[12][13] В конце того же года была подана петиция с требованием изготовить алюминиевую пластину с хранящимся на ней изображением Hatsune Miku, что должна была стать частью балансировочного груза для японского зонда Акацуки, созданного для ведения наблюдения за Венерой с её орбиты.[14] Данный проект был начат фанатом Хацуне Мику Сумио Мориока, более известного как chodenzi-P и, в последствии, получил поддержку Сэйити Сакамото, директора по работе с космическими науками в Институте космоса и астронавтики в составе Японского агентства аэрокосмических исследований. Первоначально крайний срок для сбора подписей был до 20 декабря 2009 года, но из-за некоторых задержек его продлили до 6 января 2010. 22 декабря необходимые 10000 были собраны, а к концу сбора их количество достигло 14 тысяч. 21 мая 2010 года в 06:58:22 (японское стандартное время) Акацуки был запущен на ракете-носителе H-IIA 202 Fright 17 с космодрома "Космический центр Танегасима". На борт было загружено три пластины с изображением Хацуне Мику.[15][16]

Кроме всего прочего, растущая популярность VOCALOID смотивировала появление программных обеспечений, работающих сходим образом, таких как UTAU и VOICEROID.

Критика

Как уже было сказано ранее, контингент контентмейкеров, использующих VOCALOID2 был сильно смещён с преобладания профессиональных продюсеров, как это было в первом поколении, на доминирование музыкантов-любителей, что, в свою очередь, породило ряд решений, вызвавшие резкую критику. Как пример, влияние Хатсуне Мику стало причиной отклонения вокалоидов от своей первоначальной концепции профессионального синтезатора пения, что продлилось до второй половины поколения, после чего курс стал вновь возвращаться к своей первоначальной миссии. Также успех Мику, как персонажа, стала причиной фокусировки компаний на создании притягательных образов больше, чем на качестве и естественности вокала, генерируемого голосовым банком. Исключением является VY1 и VY2, чья концепция состояла в противоборству устоявшимся трендам, что выражалось в отсутствии персонажа-маскота, а также особом напирании на качество вокала во время пиар-компании. Также это породило волну насмешек над персонажами, что, по мнению пользователей, выглядели нелепо или отталкивающе (к примеру, подобные насмешки звучали в адрес Sweet ANN).[17]

Кроме того, известность Хацуне Мику несколько негативно сказалась на завлечении новых людей к товару, поскольку неестестенность вокала в купе с неосведомлённостью о существовании более реалистичных голосов отпугивала любителей более человекоподобного вокала. Особенно остро данная проблема стояла в на англоязычном рынке, где малознакомым с темой людям было свойственно предполагать, что абсолютно все вокалоиды звучат также нереалистично, хотя на деле единственным банком второго поколения, имеющим столь же высокий вокальный диапазон был Prima, в то время, как остальные были ниже них по тону и высоте.

Также критике подвергалось различие в качестве англо и японоязычных голосовых банков, поскольку многие японские пользователи, коим доводилось использовать англоязычные банки, замечали немалую разницу между их качеством вокала и оным у японских вокалоидов. Англоязычные же фанаты, наоборот, критиковали несоответствие англоязычных банков стандартам, присущим японоязычным собратьям. Позже данные различия были объяснены тем, что голосовыми донорами для большинства английских вокалоидов стали профессиональные певцы, что привело к получению более качественных результатов. Также свою роль играет и подход к созданию, поскольку японские вокалоиды создавались с расчётом на массового японского слушателя, для коих более неестестенное пение более приемлемо.

Одной из краеугольных проблем распространения вокалоидов за пределами Японии стало банальное отсутствие информации. К примеру, сайт YAMAHA Corporation на японском языке активно обновлялся по мере появления обновлений и новинок, чего не было заметно за его англоязычным аналогом. Тоже касается и руководств по использованию, чья официальная английская версия так и не была выпущена. По этим причинам, вся поддержка ограничивалась тем, что могли дать PowerFX Systems AB. и Zero-G Limited.

Многие пользователи VOCALOID2 сходились во мнении, что, хоть новая версия и выросла в сравнении с предшественником, V2 всё ещё далёк от совершенства. Примером может служить рецензия в независимом журнале о музыкальных технологиях "Sound on Sound", составленная профессиональными обозревателями Джоном Уолденом и Томом Флинтом. В рецензии было подчёркнуто, что программное обеспечение по прежнему не может составлять ощутимой угрозы для живых певцов. Том также отдельно подметил, что за время, необходимое для освоения движка, легче нанять профессионального певца на полчаса, необходимых для записи. Тем не менее, VOCALOID2 получил высокую оценку за его улучшения в сравнении с предыдущим поколением, а также за полное изменение интерфейса, что стал причиной критики оригинального VOCALOID.[18][19]

Стоит учесть, что из-за большой популярности вокалоидов в 2007-2012, VOCALOID2 подвергался тщательному анализу со всех сторон, благодаря чему о нём и продуктах на его основе легче найти информацию и она является более подробной, нежели у голосовых банков первого, третьего и последующих поколений.

Примечания

  1. Ссылка
  2. Ссылка
  3. Начиная с Windows 7 может работать некорректно. Не функционирует или работает некорректно на Windows 2000 и 64-битных системах.
  4. Ссылка
  5. Ссылка
  6. Ссылка
  7. Ссылка
  8. Ссылка
  9. Ссылка
  10. Ссылка
  11. Ссылка
  12. Ссылка
  13. Ссылка
  14. Ссылка
  15. Ссылка
  16. Ссылка
  17. Ссылка
  18. Ссылка
  19. Ссылка
Материалы сообщества доступны в соответствии с условиями лицензии CC-BY-SA, если не указано иное.