du.sePublications
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Dialekter och röstigenkänning: Ett röstigenkännings-API:s förmåga att uppfatta svenska dialekters kännetecken och röstkombinationer
Dalarna University, School of Technology and Business Studies, Information Systems.
Dalarna University, School of Technology and Business Studies, Information Systems.
2015 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE creditsStudent thesisAlternative title
Dialects and speech recognition. : A speech recognition API:s ability to understand the characteristics and combination of sounds in Swedish dialects (English)
Abstract [sv]

Allt eftersom utvecklingen går framåt inom applikationer och system så förändras också sättet på vilket vi interagerar med systemet på. Hittills har navigering och användning av applikationer och system mestadels skett med händerna och då genom mus och tangentbord. På senare tid så har navigering via touch-skärmar och rösten blivit allt mer vanligt. Då man ska styra en applikation med hjälp av rösten är det viktigt att vem som helst kan styra applikationen, oavsett vilken dialekt man har. För att kunna se hur korrekt ett röstigenkännings-API (Application Programming Interface) uppfattar svenska dialekter så initierades denna studie med dokumentstudier om dialekters kännetecken och ljudkombinationer. Dessa kännetecken och ljudkombinationer låg till grund för de ord vi valt ut till att testa API:et med. Varje dialekt fick alltså ett ord uppbyggt för att vara extra svårt för API:et att uppfatta när det uttalades av just den aktuella dialekten. Därefter utvecklades en prototyp, närmare bestämt en android-applikation som fungerade som ett verktyg i datainsamlingen. Då arbetet innehåller en prototyp och en undersökning så valdes Design and Creation Research som forskningsstrategi med datainsamlingsmetoderna dokumentstudier och observationer för att få önskat resultat. Data samlades in via observationer med prototypen som hjälpmedel och med hjälp av dokumentstudier. Det empiriska data som registrerats via observationerna och med hjälp av applikationen påvisade att vissa dialekter var lättare för API:et att uppfatta korrekt. I vissa fall var resultaten väntade då vissa ord uppbyggda av ljudkombinationer i enlighet med teorin skulle uttalas väldigt speciellt av en viss dialekt. Ibland blev det väldigt låga resultat på just dessa ord men i andra fall förvånansvärt höga. Slutsatsen vi drog av detta var att de ord vi valt ut med en baktanke om att de skulle få låga resultat för den speciella dialekten endast visade sig stämma vid två tillfällen. Det var istället det ord innehållande sje- och tje-ljud som enligt teorin var gemensamma kännetecken för alla dialekter som fick lägst resultat överlag.

Abstract [en]

As the development of applications and systems progress so does the ways in which we interact with the application or system. So far, the navigation and usage of applications and systems have been made by hand, through keyboard and a mouse. Recently navigation through touch-screens and voice has been more common. When you are going to navigate the application with your voice, it´s crucial that anyone can navigate the application despite their dialect. To be able to see how a voice recognition API (Application Programming Interface) understands Swedish dialects a study on the characteristics on Swedish dialects were made. These characteristics and combinations of sound were the foundation to the words used for testing the API. Each dialect got a specific word that were supposed to be difficult for the API to understand when the word was pronounced by the actual dialect. A prototype of an android application was developed as a tool for data generation. This thesis contains a prototype and a research and therefore the strategy used for this thesis is Design & Creation Research, with document studies and observation as data generation methods to achieve the desired result. The data were collected through observations with the prototype as a tool and also through studies of documents. Our empirical data that has been registered through the observations and with the help of the application proved that some dialects were easier to understand correctly by the API. In some cases the results were expected because some words were made of combinations of sounds according to the theory that were going to be pronounced in a special way from a certain dialect. Some of the results were low on these certain words but in some other cases the results were surprisingly high. The conclusion we drew from this was that the words we chose with the intention of making it hard for the API to understand only proved to be working on two separate occasions. It was the word containing the combination of the sounds "sje" and "tje" that had common characteristics to all dialects, according to the theory, that got the lowest result.

Place, publisher, year, edition, pages
2015.
Keyword [sv]
Röstigenkänning, Röststyrning, Dialekter, Svenska Dialekter, Röstigenkännings-API, Språkområde, Ljudkombinationer.
National Category
Information Systems
Identifiers
URN: urn:nbn:se:du-18701OAI: oai:DiVA.org:du-18701DiVA: diva2:840129
Available from: 2015-07-07 Created: 2015-07-07

Open Access in DiVA

fulltext(1820 kB)123 downloads
File information
File name FULLTEXT01.pdfFile size 1820 kBChecksum SHA-512
2dbf77b148654128f1d45c5a03f2ddf767ecc00d0a085fb18317ea454175ff82ac1bfbd225b7c54b450efdf51e8c5c1eeacc726797dac2ab75af2496a3118080
Type fulltextMimetype application/pdf

By organisation
Information Systems
Information Systems

Search outside of DiVA

GoogleGoogle Scholar
Total: 123 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 411 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf