Utvärdering av sökmotorer i en svensk kontext
Dalarna University, School of Information and Engineering.
Dalarna University, School of Information and Engineering.
2023 (Swedish)Independent thesis Basic level (degree of Bachelor), 10 credits / 15 HE credits
Evaluating search engines in a Swedish context (English)
Abstract [en]

The focus of this study was to evaluate different search engines on Swedish text. Information retrieval is widely used by both people and organizations, and it is important to be able to efficiently retrieve needed information at the right time. The study determined that relevance and speed are the most important factors in search engines. The evaluation measures the precision and recall which are relevance measurements, and speed of two search engines, Elastic search and MarkLogic. The evaluation has determined that there is no significant difference in the relevance of the retrieved results between the engines. The evaluation has also determined that there is a statistically significant difference in speed between the engines, with Elastic search outperforming MarkLogic. Both search engines performed very well in terms of successful searches, meaning to return a relevant document in the first 20 results. Both engines succeeded in fulfilling the information need 96% of the time.

Abstract [sv]

Fokus för denna studie var att utvärdera olika sökmotorer på svensk text. Informationshämtning används i stor utsträckning av både människor och organisationer, och det är viktigt att effektivt kunna hämta nödvändig information vid rätt tidpunkt. Studien fastställde att relevans och hastighet är de viktigaste faktorerna för sökmotorer. Utvärderingen mäter precision och recall som är relevansmätvärden och responstid som hastighetmätvärde för två sökmotorer, Elasticsearch och MarkLogic. Utvärderingen har visat att det inte finns någon signifikant skillnad i relevansen av de hämtade resultaten mellan motorerna. Utvärderingen har också visat att det finns en statistiskt signifikant skillnad i hastighet mellan motorerna, där Elasticsearch överträffar MarkLogic. Båda sökmotorerna presterade väldigt bra när det gäller lyckade sökningar, vilket innebär att returnera ett relevant dokument i de första 20 resultaten. Båda motorerna lyckas uppfylla informationsbehovet 96% av tiden.

Keywords [en]
Elasticsearch, MarkLogic, search engine, search engine evaluation, relevance evaluation, precision och recall
Keywords [sv]
Elasticsearch, MarkLogic, sökmotor, sökmotorsutvärdering, relevansutvärdering, precision och recall
Information Systems
URN: urn:nbn:se:du-46567OAI: oai:DiVA.org:du-46567DiVA, id: diva2:1784987
Available from: 2023-08-01 Created: 2023-08-01

fulltext(1001 kB)
File name FULLTEXT01.pdfFile size 1001 kB
Type fulltext

School of Information and Engineering
Information Systems

Total: 179 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available


