Последний автор: Dmitriy_Minchenko
|
|
|
|
|
Автор
|
Тема: Структура человеческого голоса (Просмотрено 2394 раз)
|
|
|
Mulder
|
|
Структура человеческого голоса
# 08 сентября 2009, 11:17:17
|
Процитировать
|
Вопрос один в голове возник, относительно природы человеческого голоса. Что это такое и как это можно описать в технических понятиях. В чём различие всех голосов людей в мире, тембр, что-то ещё и можно ли это всё описать в цифрах? Цель создать фразу, которая как бы звучала голосами всех людей в мире. Т.е. в её звуке были колебания всех возможных тембральных окрасок, высот, частот звука, которые способны воспроизводить человеческие голосовые звязки.
Т.е в результате, когда вы услышите эту фразу, Вы не сможете понять чей это голос, мужчины, женщины, ребёнка, взрослого или старика и одновременно услышите звуки всех возможных существующих в мире голосов людей. От низких до высоких частот и т.д. и т.п.
Заранее благодарю за советы и понимание!
|
|
|
|
Mulder
|
Mezzanine, Друзья мои, я задумал то, добрее чего быть не может ничто так что дай Бог, Вам помочь мне советом!
LeStR, а Корпускул у нас звукорежиссёр?
Языка, мысли мягче и не будет жести
|
|
|
|
нано-оміч
|
Мнэм, синтезом врядли получится
т.е. тебе надо будет синтезировать либо множество разных голосов по отдельности, либо, типа рассчитать каким тоговый голос должен быть при смешении всех(по твоей задумке) мыслимых и немыслимых голосов
Но синтез голоса - я хз, ничего приличнозвучащего за всё время своего существования я не слышал
дык ещё тебе же с определённой интонацией надо...так что хм...
я вижу только тупое решение - запись различных голосов, но фраза должна быть произнесена каждым максимально близко к оригиналу во всех смыслах.
мне кажется 10-20 голсоов смешаешь - это уже будет предел, больше уже, думаю, мозгом не различишь. но массовость будет создаваться
|
|
|
|
Lucky_Ganesh
|
думаю для этого придётся всё таки сходить в библиотеку, набрать кучу книг по физике, волнам и прочей хне и долго и внимательно читать))
и ещё заодно думаю не помешает там-же взять книги по медицине и анатомии))
|
|
|
|
corpuscul123232
|
Мнэм, синтезом врядли получится
|
|
на "западе" сейчас именно технологии синтеза человеческой речи и получают развитие и более широкое применение в мультимедии. Автору могу посоветовать в качестве примера:
набрать в гугле "speech" или "speech synthesis" (сомневаюсь что на русском есть толковая информация).
Ну а если интересно именно темброобразование голосов, то тут тебе форманты в помощь, на которых, кстати, часть вокодеров основывается при преобразовании звука.
Теория:
http://corpuscul.net/shkola/postanovka-golosa/rabota-golosovogo-appara...
http://corpuscul.net/shkola/postanovka-golosa/akkustika-golosovogo-app...
http://corpuscul.net/shkola/postanovka-golosa/golosovoj-apparat/
Это три серии статей, в которых рассматривается формирование тембра человеческого голоса, если же интересно пение, то на сайте есть и по этому делу статьи, и кстати не только на этом
========================
прочитав более внимательно вопрос автора, понял чтоне совсем то посоветовал, а точнее то что автор не то спрашивал так как хотел узнать другое. Тебе не темброобразование голоса нужно смотреть а психоакустику и информацию по тембрам в целом:
http://corpuscul.net/tag/tembr/
http://corpuscul.net/teoriya-zvuka-2/psixoakustika/
вот ещё неплохая статейка:
http://corpuscul.net/sintez-i-obrabotka-zvuka/caund-dizajn/ogibayushhi...
В ней именно структура тембра звука рассматривается (характеристика звука описывается тембром, который в свою очередь подразумевает спектр (частотная характеристика, чем выше частота звука - тем меньше период волны, из таких вот простых волн-гармоник все звуки и формируются) и амплитудной характеристике (ADSR) Атака, пик, держание, спад, которой также описываются все существующие звуки).
п.с. юмор: помню лет эдак 8 назад ходил на Одесскую выставку "Свет, звук, и ещё что-то там", на ней куча синтезаторов и всяких железных новинок много выставлялось. Где купил книгу по электроакустике (продавец явно не ожидал такой выбор :))) ) и посетил концефернцию по теории звука, на которой было 5 человек =)))) Так я к чему, там дядя-профессор, говорил что если у пианины вырезать стадию атаки звука, то мы не сможем распознать интрумент, в качестве примера.
В любом случае, если интересуют такие вопросы, то можно попробовать записаться на курс звукорежиссуры, в целом я лично психоакустику использовал работая с криптографией, конкретно, эффект маскировки. Который кстати и при компрессии и при конвертировании в мп3 используется (если программы сделаны не на синтэдите %))) ). В общем учение в свет. Гугл сказал - искать искать и ещё раз искать!
корп, идём лучше радио слушать!! |
|
Та я бы с удовольствием, но меня на второй год оставили учить математику эти французы-бюрократы, и мне это надоело и работать хочу . прикольная группа кстати собралась, французы в меньшенстве Учусь с мароканцем (подучиваю арабский для налаживания дип. отношений ) и с двумя румынками, одной из которых вот приготовил книжечку 1930 года на подарок (в которой почему то написано - что мол все права принадлежат автору, и переводов тоже, включая россию Блин, они правда такие наивные или это я дурак, или до них весть о существовании СССР ешё не дошла ), так вот книжечка - пособие для гадалок на французском мол по рукам. Дело в том что эта румынка ну просто вылитая цыганка, ну увидел её сразу же вспомнил Одесских цыганок-гадалок . В общем скажу ей, как славянин славянке, что надо своими корнями гордиться.
ушёл учить дифферанциальные уравнения
п.с. простите за бредофтопик, я просто по русски что-то написать захотел, жажда эдакая!
|
|
|
|
Mezzanine
|
не совсем в тему, но вспомнил сразу об этом топике наткнувшись на такое занятное видео -
|
|
|
|
Fedot
|
Человеческие голоса различаются формантами. Форманта - это повторяющийся "микросэмпл", который генерируется связками, и затем фильтруется положением губ, языка, и т.д.; таким образом получаются звуки, соответствующие разным буквам.
Индийская традиционная музыка рассматривает человеческий голос как совершенный музыкальный инструмент. Все прочие инструменты лишь имитируют голос. А если говорить о речи, то считается, что все буквы происходят из первоначального звука "Ом", который и содержит в себе все возможные голоса и звуки. Поэтому можно качать Ом'овые мантры, и не париться с синтезом.
|
|
|
|
Показать последних комментариев к сообщениям в теме
|
|