hlavní-stránka › Články › metody-zvukove-syntezy

Metody zvukové syntézy

Jak vytvořit zvuk?

Zvuková syntéza je odvětví zabývající se řízeným vznikem zvuku. Zvukovou syntézou rozumíme libovolný proces vedoucí k vytvoření předvídatelného nebo i nepředvídatelného zvuku. Z této definice plyne zarážející poučení, že existuje nepřeberné a snad i nesystematizovatelné množství způsobů, jak vytvořit zvuk, či generovat signál, který se jako zvuk dá interpretovat. Nás však bude zajímat jen několik vybraných, matematicky vytříbených metod, které efektivně naplňují záměr syntézy.

V praxi zvukové syntézy čelíme nejčastěji dvěma úkolům. Prvním je vytváření zvuků napodobujících co nejvěrohodněji klasické, již existující hudební nástroje, modelováním reálného zdroje. Tím druhým je pak tvorba nových, neslýchaných zvuků nemající v okolním světě žádnou obdobu. O trochu těžší to má první úloha, protože v tomto případě máme s čím srovnávat a můžeme objektivně hodnotit. Hudební nástroj totiž nelze zidealizovat statickou posloupností diskrétních čar spektra, jak bychom očekávali u čistého tónu. Ve hře je mnoho faktorů, jejichž vliv se dá do modelu těžko přidávat nebo na jejichž vliv není brán vůbec zřetel. U piána je to například neperiodický zvuk kladívka nebo rezonance sousedních strun. Výsledné spektrum není potom diskrétní, ale částečné spojité, což se dá posléze obtížně generovat. V současné době je hojně používané hybridní pojetí, kdy je reálný nástroj nasamplován, ale současně si s sebou nese jednoduchý model, který umožní zvuk následně zčásti modifikovat.

K dnešní době známe celou řadu metod elektronické syntézy. Jednotlivé syntézy nejsou vzájemně zcela zastupitelné a nepokrývají úplný prostor všech možných zvuků. To znamená, že jednou konkrétní metodou se nemusím notně dobrat kýženého zvuku. Většinou však nejde přímo o nemožnost, ale spíše o zvýšenou krkolomnost a neobratnost v dobrání se žádoucímu výsledku.

Ačkoliv existuje více kritérií a rovin, přes které se jednotlivé syntézy dají členit, uchýlím se ke klasické typologii nezávislé na technické realizaci.

Přehled metod:

Součtové (aditivní)
Rozdílové (analogové, subtraktivní)
Modulační

Frekvenční modulace
Amplitudová modulace
Kruhová modulace

Tvarové

Nelineární tvarování
Přímé zadávání časového průběhu
Fázové zkreslení

Slučovací

Segmentační
Granulační
Formantová

Samplovací
Fyzikální modelování – virtuální akustická syntéza

Součtová syntéza

Součtová syntéza, nebo také často aditivní syntéza, patří k nejstarším způsobům generace zvukového signálu. Je založena na prostém součtu jednoduchých signálů, v nejjednodušším případě prostých sinusovek. Vše se dá vyjádřit vzorcem:

kde A_k…amplituda, ω_k…frekvence, φ_k…fáze k-té složky tónu při počtu složek N. Aby se vystihla i nestacionarita signálu bylo by nutné vyjádřit všechny proměnné k-té složky jako funkci času.

Příklad zastoupení jednotlivých harmonických u reálných nástrojů je na následující tabulce.

	1.	2.	3.	4.	5.	6.	7.	8.	9.	10.
Trubka	0,17	0,63	0,57	0,98	0,56	0,68	0,02	0,05	-	-
Harmonika	8,60	0,45	3,40	0,50	0,42	0,13	0,13	0,16	0,04	0,35
Flétna	2,54	0,25	0,01	-	-	-	-	-	-	-
Klarinet	1,00	0,00	0,07	0,00	0,50	0,00	0,14	0,50	0,00	0,12
Hoboj	0,02	0,20	1,00	0,37	0,36	0,46	0,10	0,06	0,03	0,02
Piano	0,32	0,20	0,08	0,07	0,06	-	-	-	-	-
Housle	0,39	0,30	0,17	0,01	0,11	-	-	-	-	-
Hlas	0,43	0,08	0,01	-	-	-	-	-	-	-

Tab. 1 Sbírka amplitudových spekter (sloupce jsou jednotlivé harmonické)

Zkušený analytik dokáže již na základě takovéto tabulky odhadnout výsledný zvuk. Při syntéze zvuků tónového charakteru jsou poměry mezi frekvencemi jednotlivých harmonických celočíselné nebo kvazičíselné. Počet slyšitelných složek může nabývat až 250, ale k přijatelné aproximaci si obyčejně vystačíme jen s prvními deseti. Součtová syntéza je považována za nejdokonalejší a nejautonomnější metodu zvukové syntézy, u níž má hudebník neustálou kontrolu nad celým procesem. Přes tyto klady není tato metoda samostatně komerčně rozšířena. Argument konstrukční náročnosti je dnes sice smazán použitím výpočetní techniky, ale přesto tento koncept nepřináší hudební uspokojení. Velká kontrola procesu sebou přináší také velké úsilí pro dosažení konkrétního cíle, který by byl dosažen jen změnou jednoho parametru odlišnou metodou. Někdy je totiž náhoda a nepředvídatelnost méně průhledných technik tím nejkreativnějším prvkem.

Rozdílová syntéza

Rozdílová syntéza je bezesporu jedna z nejrozšířenějších a komerčně nejúspěšnějších metod. Oblibu si získala ve své realizační jednoduchosti a současně vysoké zvukové účinnosti. Hlavně v západních zdrojích je pro svůj princip nazývaná kromě subtraktivní též jako analogová. Fyzikální princip subtraktivní syntézy je ve formální shodě s přirozeným vznikem zvuků v hudebních nástrojích nebo v tvorbě lidského hlasu [1].

Tak například při modelování tvorby řeči je celý řetězec hlasového traktu zobecněn na buzení a filtr. Pulzní buzení vznikající přirozeně v hlasivkách je nahrazeno jiným frekvenčně bohatým signálem. Rezonanční dutiny (nosní, hrdelní, ústní) a překážky jako jazyk rty a zuby jsou zobecněny jediným řízeným filtrem, který slouží jako rezonanční obálka tvarující vstupní signál. Další analogií je hra na housle, kde je spektrum zdrojového zvuku (kmitající struna) tvarováno rezonátorem (korpus houslí). (obr. 2)

V procesu nevznikají žádné nové frekvenční složky signálu, ale ty stávající jsou pouze potlačeny nebo naopak zvýrazněny. Tato skutečnost nás omezuje v tvorbě úplné množiny zvuků, a tak bývá rozdílová syntéza doplňována dalšími metodami jako frekvenční nebo amplitudová modulace. Filtr bývá realizován jako dolní respektive pásmová propust s řízenou frekvencí poklesu a činitelem jakosti. Oproti řečovému signálu, který mívá několik zřetelných rezonančních frekvencí nazývaných formanty, zjednodušujeme situaci u hudebního signálu obvykle jen na jednu rezonanci uskutečněnou jednoduchým čtyř-pólovým filtrem. Neméně důležité je řízené zesílení výsledného signálu amplitudovou obálkou dodávající signálu dynamické vlastnosti reálných nástrojů.

Modulační syntéza

Modulační metody zvukové syntézy těží z nelineární povahy modulačního procesu, kdy vznikají zcela nové harmonické složky úměrné součtům a rozdílům již přítomných frekvencí. V případě komplexního nosného signálu vzniká bohatý a hutný zvuk, který může mít jak tónový, tak i šumový charakter v závislosti na racionalitě poměrů přítomných frekvencí. Všechny tři parametry, tj. nosná frekvence ω0, modulační frekvence Ω i index modulace β mohou být časově proměnné, čímž se docílí vývoje spektra, nebo přechod mezi tónovým a hlukovým charakterem zvuku. Obyčejně je možné použít několikanásobnou modulaci, nebo třeba i zpětnovazební modulaci sebou samým.

**Obr. 3** Zjednodušené blokové schéma frekvenční a amplitudové modulace

Frekvenční modulace

Na rozdíl od amplitudové, či kruhové modulace, které se používají spíše jako doplňkové efekty k jiným typům syntéz, si frekvenční syntéza získala postavení autonomní syntézy, která naplnila všechny objektivní příčiny zvuku [1]. Umožňuje plynulý přechod mezi harmonickými a neharmonickými strukturami jednoduchým rozladěním modulační frekvence vůči nosné v iracionálním poměru. Oproti rozdílové syntéze není limitována pevnou harmonickou strukturou.

Frekvenční modulace je velmi vhodná pro různé efekty a ruchy. Je kupříkladu velmi vhodná pro emulaci zvonů.

Amplitudová modulace

Podstatou amplitudové modulace je změna amplitudy jiným signálem. Nosnou frekvencí může být sinusovka. Modulační frekvencí může být rovněž sinusovka (nižší než nosná frekvence).

Kruhová modulace (Ring Modulation)

Kruhová modulace je principiálně velmi podobná modulaci amplitudové a vychází ze stejné matematické formule prostého násobení nosného a modulačního signálu v časové rovině:

Stejně tak jako u AM vznikne při násobení dvou harmonických signálů součtová a rozdílová složka ale navíc se potlačí ta původní. Přívlastek kruhový (v anglosaské lit. Ring Modulation) si modulace vydobyla vzezřením svých analogových obvodů, kde je příznačné zapojení usměrňovacích diod do kruhu.

Kruhová modulace byla extenzivně používána v elektronické prehistorii 50. – 60. let kdy oscilátory byly schopny běžně generovat jen základní tvary vln. Hodně jí využíval Vangelis na své Yamaze CS80. Výsledný zvuk zní tak jakoby rozviklaně, metalicky, evokující zvony. Výborně se hodí při emulaci elektrických výbojů. Jev, který může znít jako cvrkot, je slyšitelný nejlépe, je-li jedna z frekvencí velmi malá (okolo 10 Hz) a druhá okolo 1 kHz.

**Obr.4** Frekvenční spektrum; Nosný signál C o frekvenci 900 Hz a modulační signál M o frekvenci 500Hz; Amplitudová modulace ponechává frekvenci původního nosného signálu

Tvarová syntéza

Pod pojmem tvarová syntéza se skrývá mnoho rozmanitých technik vytváření zvukového signálu, které na rozdíl od dosud zmíněných metod, používají operace přístupné v časové doméně.

Nelineární tvarování

Metoda nelineárního tvarování je založena na průchodu signálu obvodem s nelineární charakteristikou. Nelinearitou vznikají součtové a rozdílové složky vstupního signálu, tedy na rozdíl od předešlých metod zcela nové harmonické složky.

Přímé zadávání časového průběhu

Za pomocí grafického prostředí nebo proměnných parametrů je možné přímo měnit tvar signálu. Nevýhoda tohoto jednoduchého procesu vycházející z méně průkazné časové oblasti je téměř nulová kontrola výsledného vyznění.

Fázové zkreslení

Fázové zkreslení přehází v diskrétní podobě jednotlivé vzorky v periodě, takže vznikne nový tvar vlny s novým spektrem.

Slučovací syntézy

Slučovací syntézy mají společné to, že využívají skládání malých zvukových jednotek dlouhých pár milisekund do větších, zvukové zajímavých celků. Navzájem se liší délkou, původem a složitostí těchto jednotek.

Segmentační syntéza

Segmentační metody skládají požadovaný průběh signálu ze segmentů přesně zadaných křivek. Tímto můžeme klasický proces vzorkování chápat jako obdélníkovou segmentaci. Lineární segmentace neboli prosté spojení definovaných bodů má časté využití při realizaci ovládacích signálů, například amplitudová obálka.

Granulační syntéza

Granulační syntéza používá pro generování zvuků krátkých úseků zvuku (okolo 50ms) tzv. granulek. Tyto úseky se přehrávají velmi rychle za sebou, takže lidský mozek je vnímá jako spojitý zvuk.

Formantová syntéza

Formantová syntéza se využívá takřka výhradně v souvislosti zpracování řečových signálů. Řečový signál rozdrobí na nejelementárnější stavební jednotky, ze kterých pak může syntetizovat jakoukoliv větu. Takovou jednotkou může být v případě kupříkladu samohlásek i samotná hláska. Většinou je ale každá hláska složena z více formantů.

Samplovací metoda

Nejedná se přímo o techniku vytvářející nový signál, jak to bylo v předešlých případech, ale spíše o úplně novou filozofii nakládání se zvukem. Spíše tedy než o syntezátor se jedná o přehrávač předem uložených zvuků. Výhoda věrného přednesu nasamplovaného nástroje a v dnešní době jednoduché realizace je smutně vyvážena nízkou variabilitou výsledného zvuku a často strojově mdlým přednesem. Hráč má jen omezené možnosti tvůrčího projevu, ale může zároveň disponovat obrovským množstvím již předem připravených zvuků.

Fyzikální modelování – virtuální akustická syntéza

V roce 1993 přišla firma YAMAHA s naprosto novou koncepcí hudebních nástrojů - s virtuálně akustickými syntezátory, které nejsou jen lepší modifikací starších syntezátorů. Jde o zcela odlišné nástroje, pracující na jiném principu, než je přehrávání nasamplovaných zvuků. U všech nástrojů, zvláště dechových, se zjišťoval způsob tvorby zvuku a veškeré jevy, které se při tvorbě zvuku uplatňují. Fyzikální model každého nástroje je tedy de facto souhrn maximálního množství údajů, které nástroj popisují. U dechových nástrojů to může být například materiál, z něhož je nástroj vyroben, vlastnosti plátku, hubičky, tvar vzduchového sloupce uvnitř nástroje apod. Z těchto parametrů je virtuálně akustický nástroj schopen v reálném čase vypočítat kýžený zvuk, který je víceméně totožný se zvukem skutečného nástroje. Zatímco dosud používané technologie simulují zvuk, VAS simuluje přímo nástroj. [cit. 3]

Princip VA syntézy vychází z obecného modelu akustického nástroje a je na první pohled velmi podobný struktuře rozdílové syntézy (obr. 5). Oproti ní však klade mnohem větší důraz na způsob buzení (EXCITÁTOR). U hudebního nástroje a VA syntézy je těžiště v aktivní generaci tónu (například interakce smyčce a struny), kdežto v případě subtraktivní syntézy v aktivním zpracování signálu (řízená filtrace a zesílení) [cit. 1].

Řada autorů vidí právě v tomto způsobu syntézy budoucnost vývoje elektronických nástrojů. Syntéza není limitována svojí technologií a její zvuk s ní není ztotožněn, jako je tomu například u subtraktivní syntézy. Výsledný zvuk je změnou svých parametrů předvídatelný a je úzce spjat s přirozeným fyzikálním chápáním okolního světa. Zvětšíme-li například rozměr rezonátoru, dá se předpokládat, že výsledný zvuk bude hlubší a mohutnější. Tato intuitivnost se dalším hraním výrazně zlepšuje a umožní lépe realizovat hudebníkův záměr. Dalším kladem VAS syntézy je zvuková podobnost či přesnost imitace. Samplovací metoda sice dokáže velmi zdatně reprodukovat zvuk napodobovaného nástroje, v kontextu větších hudebních celků však oproti VAS selhává [2]. Fyzikální modelování dokáže napodobit i takové nuance přechodových jevů jako jsou dýchání, cvakání kláves, klouzání prstů a přenos rezonance předchozích tónů. Všechny tyto zdánlivě parazitní efekty humanizují elektronické dílo a přispívají ke komplexnímu přednesu. Smysluplnost imitativní role je často zpochybňována potřebou specifického ovladače ne nepodobnému skutečnému nástroji. Nabízí se tedy otázka proč používat elektronický model ovládaný takovýmto klonem namísto skutečného nástroje. Nepostavíme-li obhajobu na obrovském potenciálu při tvorbě nových kontrolovatelných zvuků, můžeme zmínit i vznik nové kreativní roviny použitím nestandardních ovladačů jako třeba ovládat kytaru dechovým nástrojem.

Více k problematice je možné naleznout v [1, 2].

[1] Syrový, Václav: Hudební akustika. Vydání 1. Akademie múzických umění, Praha 2003
[2] Ondřej Urban: Instrumentář elektroakustického zvuku. Akademie múzických umění, Praha 2007
[3] Miroslav Hlavička: Virtuálně akustická syntéza, revoluce ve výrobě zvuku.

▉ Telotone | 26/06/2009; aktualizace 19/05/2013

DISKUZE

Diskuze obsahuje 3 příspěvků

Vložit příspěvek:

#1203 | 213.226.206.197

30. dubna 2013 | Jan

Pěkný článek :)

#1180 | 81.25.16.87

18. prosince 2010 | telotone

Mohl bys to trochu konkrettizovat?

#1177 | 194.160.127.2

15. prosince 2010 | .lll

lll

sllabe