From abfc9c73744beba1b15274bd53f83bbda018cf1d Mon Sep 17 00:00:00 2001 From: Minoru Osuka Date: Sun, 17 Mar 2019 21:57:42 +0900 Subject: [PATCH] Update examples --- example/doc_arwiki_1.json | 1 - example/doc_bgwiki_1.json | 1 - example/doc_cawiki_1.json | 1 - example/doc_cswiki_1.json | 1 - example/doc_dawiki_1.json | 1 - example/doc_dewiki_1.json | 1 - example/doc_elwiki_1.json | 1 - example/doc_enwiki_1.json | 1 - example/doc_eswiki_1.json | 1 - example/doc_fawiki_1.json | 1 - example/doc_fiwiki_1.json | 1 - example/doc_frwiki_1.json | 1 - example/doc_gawiki_1.json | 1 - example/doc_glwiki_1.json | 1 - example/doc_guwiki_1.json | 1 - example/doc_hiwiki_1.json | 1 - example/doc_huwiki_1.json | 1 - example/doc_hywiki_1.json | 1 - example/doc_idwiki_1.json | 1 - example/doc_itwiki_1.json | 1 - example/doc_jawiki_1.json | 1 - example/doc_knwiki_1.json | 1 - example/doc_kowiki_1.json | 1 - example/doc_mlwiki_1.json | 1 - example/doc_nlwiki_1.json | 1 - example/doc_nowiki_1.json | 1 - example/doc_pswiki_1.json | 1 - example/doc_ptwiki_1.json | 1 - example/doc_rowiki_1.json | 1 - example/doc_ruwiki_1.json | 1 - example/doc_svwiki_1.json | 1 - example/doc_tawiki_1.json | 1 - example/doc_tewiki_1.json | 1 - example/doc_thwiki_1.json | 1 - example/doc_trwiki_1.json | 1 - example/doc_zhwiki_1.json | 1 - example/index_mapping.json | 72 +++++++++++++++++++------------------- 37 files changed, 36 insertions(+), 72 deletions(-) diff --git a/example/doc_arwiki_1.json b/example/doc_arwiki_1.json index 14b2358..8b766f0 100644 --- a/example/doc_arwiki_1.json +++ b/example/doc_arwiki_1.json @@ -1,7 +1,6 @@ { "title_ar": "محرك بحث", "text_ar": "محرك البحث (بالإنجليزية: Search engine) هو نظام لإسترجاع المعلومات صمم للمساعدة على البحث عن المعلومات المخزنة على أي نظام حاسوبي. تعرض نتائج البحث عادة على شكل قائمة لأماكن تواجد المعلومات ومرتبة وفق معايير معينة. تسمح محركات البحث باختصار مدة البحث والتغلب على مشكلة أحجام البيانات المتصاعدة (إغراق معلوماتي).", - "contributor": "unknown", "timestamp": "2018-03-25T18:04:00Z", "_type": "arwiki" } diff --git a/example/doc_bgwiki_1.json b/example/doc_bgwiki_1.json index 4e31eff..0b585be 100644 --- a/example/doc_bgwiki_1.json +++ b/example/doc_bgwiki_1.json @@ -1,7 +1,6 @@ { "title_bg": "Търсачка", "text_bg": "Търсачка или търсеща машина (на английски: Web search engine) е специализиран софтуер за извличане на информация, съхранена в компютърна система или мрежа. Това може да е персонален компютър, Интернет, корпоративна мрежа и т.н. Без допълнителни уточнения, най-често под търсачка се разбира уеб(-)търсачка, която търси в Интернет. Други видове търсачки са корпоративните търсачки, които търсят в интранет мрежите, личните търсачки – за индивидуалните компютри и мобилните търсачки. В търсачката потребителят (търсещият) прави запитване за съдържание, отговарящо на определен критерий (обикновено такъв, който съдържа определени думи и фрази). В резултат се получават списък от точки, които отговарят, пълно или частично, на този критерий. Търсачките обикновено използват редовно подновявани индекси, за да оперират бързо и ефикасно. Някои търсачки също търсят в информацията, която е на разположение в нюзгрупите и други големи бази данни. За разлика от Уеб директориите, които се поддържат от хора редактори, търсачките оперират алгоритмично. Повечето Интернет търсачки са притежавани от различни корпорации.", - "contributor": "unknown", "timestamp": "2018-07-11T11:03:00Z", "_type": "bgwiki" } diff --git a/example/doc_cawiki_1.json b/example/doc_cawiki_1.json index 072029c..119c247 100644 --- a/example/doc_cawiki_1.json +++ b/example/doc_cawiki_1.json @@ -1,7 +1,6 @@ { "title_ca": "Motor de cerca", "text_ca": "Un motor de cerca o de recerca o bé cercador és un programa informàtic dissenyat per ajudar a trobar informació emmagatzemada en un sistema informàtic com ara una xarxa, Internet, un servidor o un ordinador personal. L'objectiu principal és el de trobar altres programes informàtics, pàgines web i documents, entre d'altres. A partir d'una determinada paraula o paraules o una determinada frase l'usuari demana un contingut sota un criteri determinat i retorna una llista de referències que compleixin aquest criteri. El procés es realitza a través de les metadades, vies per comunicar informació que utilitzen els motors per cada cerca. Els índex que utilitzen els cercadors sempre estan actualitzats a través d'un robot web per generar rapidesa i eficàcia en la recerca. Els directoris, en canvi, són gestionats per editors humans.", - "contributor": "unknown", "timestamp": "2018-07-09T18:07:00Z", "_type": "cawiki" } diff --git a/example/doc_cswiki_1.json b/example/doc_cswiki_1.json index 8200dd9..1f222ef 100644 --- a/example/doc_cswiki_1.json +++ b/example/doc_cswiki_1.json @@ -1,7 +1,6 @@ { "title_cs": "Vyhledávač", "text_cs": "Vyhledávač je počítačový systém či program, který umožňuje uživateli zadat nějaký libovolný nebo specifikovaný vyhledávaný výraz a získat z velkého objemu dat informace, které jsou v souladu s tímto dotazem. Jako vyhledávač se označují i ​​webové stránky, jejichž hlavní funkcí je poskytování takového systému či programu. Jako internetový vyhledávač se označuje buď vyhledávač, na který se přistupuje přes internet, nebo vyhledávač, jehož zdrojem vyhledávání je internet (tj. WWW, Usenet apod.). Jako online vyhledávač se označuje vyhledávač, při jehož výkonu činnosti dochází k výměně dat v rámci nějaké počítačové sítě, nejčastěji to je internetový vyhledávač. Fulltextový vyhledávač je vyhedávač, který vykonává fulltextové vyhledávání.", - "contributor": "unknown", "timestamp": "2017-11-10T21:59:00Z", "_type": "cswiki" } diff --git a/example/doc_dawiki_1.json b/example/doc_dawiki_1.json index eddd565..e38abbb 100644 --- a/example/doc_dawiki_1.json +++ b/example/doc_dawiki_1.json @@ -1,7 +1,6 @@ { "title_da": "Søgemaskine", "text_da": "En søgemaskine er en applikation til at hjælpe en bruger med at finde information. Det kan f.eks. være at finde filer med bestemte data (f.eks. ord), gemt i en computers hukommelse, for eksempel via World Wide Web (kaldes så en websøgemaskine). Ofte bruges søgemaskine fejlagtigt om linkkataloger eller Netguider.", - "contributor": "unknown", "timestamp": "2017-09-04T01:54:00Z", "_type": "dawiki" } diff --git a/example/doc_dewiki_1.json b/example/doc_dewiki_1.json index c25ce46..ffeb346 100644 --- a/example/doc_dewiki_1.json +++ b/example/doc_dewiki_1.json @@ -1,7 +1,6 @@ { "title_de": "Suchmaschine", "text_de": "Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z. B. dem World Wide Web gespeichert sind. Internet-Suchmaschinen haben ihren Ursprung in Information-Retrieval-Systemen. Sie erstellen einen Schlüsselwort-Index für die Dokumentbasis, um Suchanfragen über Schlüsselwörter mit einer nach Relevanz geordneten Trefferliste zu beantworten. Nach Eingabe eines Suchbegriffs liefert eine Suchmaschine eine Liste von Verweisen auf möglicherweise relevante Dokumente, meistens dargestellt mit Titel und einem kurzen Auszug des jeweiligen Dokuments. Dabei können verschiedene Suchverfahren Anwendung finden.", - "contributor": "unknown", "timestamp": "2017-09-04T01:54:00Z", "_type": "dewiki" } diff --git a/example/doc_elwiki_1.json b/example/doc_elwiki_1.json index b22943b..b4eb58e 100644 --- a/example/doc_elwiki_1.json +++ b/example/doc_elwiki_1.json @@ -1,7 +1,6 @@ { "title_el": "Μηχανή αναζήτησης", "text_el": "Μια μηχανή αναζήτησης είναι μια εφαρμογή που επιτρέπει την αναζήτηση κειμένων και αρχείων στο Διαδίκτυο. Αποτελείται από ένα πρόγραμμα υπολογιστή που βρίσκεται σε έναν ή περισσότερους υπολογιστές στους οποίους δημιουργεί μια βάση δεδομένων με τις πληροφορίες που συλλέγει από το διαδίκτυο, και το διαδραστικό περιβάλλον που εμφανίζεται στον τελικό χρήστη ο οποίος χρησιμοποιεί την εφαρμογή από άλλον υπολογιστή συνδεδεμένο στο διαδίκτυο. Οι μηχανές αναζήτησης αποτελούνται από 3 είδη λογισμικού, το spider software, το index software και το query software.", - "contributor": "unknown", "timestamp": "2017-11-21T19:57:00Z", "_type": "elwiki" } diff --git a/example/doc_enwiki_1.json b/example/doc_enwiki_1.json index 05b77a8..0173803 100644 --- a/example/doc_enwiki_1.json +++ b/example/doc_enwiki_1.json @@ -1,7 +1,6 @@ { "title_en": "Search engine (computing)", "text_en": "A search engine is an information retrieval system designed to help find information stored on a computer system. The search results are usually presented in a list and are commonly called hits. Search engines help to minimize the time required to find information and the amount of information which must be consulted, akin to other techniques for managing information overload. The most public, visible form of a search engine is a Web search engine which searches for information on the World Wide Web.", - "contributor": "unknown", "timestamp": "2018-07-04T05:41:00Z", "_type": "enwiki" } diff --git a/example/doc_eswiki_1.json b/example/doc_eswiki_1.json index 7d6fd9c..d1747f8 100644 --- a/example/doc_eswiki_1.json +++ b/example/doc_eswiki_1.json @@ -1,7 +1,6 @@ { "title_es": "Motor de búsqueda", "text_es": "Un motor de búsqueda o buscador es un sistema informático que busca archivos almacenados en servidores web gracias a su spider (también llamado araña web). Un ejemplo son los buscadores de Internet (algunos buscan únicamente en la web, pero otros lo hacen además en noticias, servicios como Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda «Página de resultados del buscador» es un listado de direcciones web en los que se mencionan temas relacionados con las palabras clave buscadas. Como operan de forma automática, los motores de búsqueda contienen generalmente más información que los directorios. Sin embargo, estos últimos también han de construirse a partir de búsquedas (no automatizadas) o bien a partir de avisos dados por los creadores de páginas.", - "contributor": "unknown", "timestamp": "2018-08-30T11:30:00Z", "_type": "eswiki" } diff --git a/example/doc_fawiki_1.json b/example/doc_fawiki_1.json index fcadc3d..1457b00 100644 --- a/example/doc_fawiki_1.json +++ b/example/doc_fawiki_1.json @@ -1,7 +1,6 @@ { "title_fa": "موتور جستجو (پردازش)", "text_fa": "موتور جستجو یا جویشگر، در فرهنگ رایانه، به طور عمومی به برنامه‌ای گفته می‌شود که کلمات کلیدی را در یک سند یا بانک اطلاعاتی جستجو می‌کند. در اینترنت به برنامه‌ای گفته می‌شود که کلمات کلیدی موجود در فایل‌ها و سندهای وب جهانی، گروه‌های خبری، منوهای گوفر و آرشیوهای FTP را جستجو می‌کند. جویشگرهای زیادی وجود دارند که امروزه از معروفترین و پراستفاده‌ترین آنها می‌توان به google و یاهو! جستجو اشاره کرد.", - "contributor": "unknown", "timestamp": "2017-01-06T02:46:00Z", "_type": "fawiki" } diff --git a/example/doc_fiwiki_1.json b/example/doc_fiwiki_1.json index ec54eee..78d6861 100644 --- a/example/doc_fiwiki_1.json +++ b/example/doc_fiwiki_1.json @@ -1,7 +1,6 @@ { "title_fi": "Hakukone", "text_fi": "Hakukone on web-pohjainen ohjelma, joka etsii jatkuvasti Internetistä (varsinkin Webistä) uusia sivuja eritellen ja liittäen ne hakemistoonsa erityisten hakusanojen mukaan. Näitä hyväksi käyttäen hakukone tulostaa käyttäjän syöttämiä hakusanoja lähimpänä olevat sivut. Analysointi tapahtuu käytännössä eri hakukoneissa erilaisilla menetelmillä.", - "contributor": "unknown", "timestamp": "2017-10-04T14:33:00Z", "_type": "fiwiki" } diff --git a/example/doc_frwiki_1.json b/example/doc_frwiki_1.json index 6f4f822..f90c893 100644 --- a/example/doc_frwiki_1.json +++ b/example/doc_frwiki_1.json @@ -1,7 +1,6 @@ { "title_fr": "Moteur de recherche", "text_fr": "Un moteur de recherche est une application web permettant de trouver des ressources à partir d'une requête sous forme de mots. Les ressources peuvent être des pages web, des articles de forums Usenet, des images, des vidéos, des fichiers, etc. Certains sites web offrent un moteur de recherche comme principale fonctionnalité ; on appelle alors « moteur de recherche » le site lui-même. Ce sont des instruments de recherche sur le web sans intervention humaine, ce qui les distingue des annuaires. Ils sont basés sur des « robots », encore appelés « bots », « spiders «, « crawlers » ou « agents », qui parcourent les sites à intervalles réguliers et de façon automatique pour découvrir de nouvelles adresses (URL). Ils suivent les liens hypertextes qui relient les pages les unes aux autres, les uns après les autres. Chaque page identifiée est alors indexée dans une base de données, accessible ensuite par les internautes à partir de mots-clés. C'est par abus de langage qu'on appelle également « moteurs de recherche » des sites web proposant des annuaires de sites web : dans ce cas, ce sont des instruments de recherche élaborés par des personnes qui répertorient et classifient des sites web jugés dignes d'intérêt, et non des robots d'indexation. Les moteurs de recherche ne s'appliquent pas qu'à Internet : certains moteurs sont des logiciels installés sur un ordinateur personnel. Ce sont des moteurs dits « de bureau » qui combinent la recherche parmi les fichiers stockés sur le PC et la recherche parmi les sites Web — on peut citer par exemple Exalead Desktop, Google Desktop et Copernic Desktop Search, Windex Server, etc. On trouve également des métamoteurs, c'est-à-dire des sites web où une même recherche est lancée simultanément sur plusieurs moteurs de recherche, les résultats étant ensuite fusionnés pour être présentés à l'internaute. On peut citer dans cette catégorie Ixquick, Mamma, Kartoo, Framabee ou Lilo.", - "contributor": "unknown", "timestamp": "2018-05-30T15:15:00Z", "_type": "frwiki" } diff --git a/example/doc_gawiki_1.json b/example/doc_gawiki_1.json index e639243..492dc58 100644 --- a/example/doc_gawiki_1.json +++ b/example/doc_gawiki_1.json @@ -1,7 +1,6 @@ { "title_ga": "Inneall cuardaigh", "text_ga": "Acmhainn ar an ngréasán domhanda atá insroichte le brabhsálaí Gréasáin, a chabhraíonn leis an úsáideoir ionaid is eolas a aimsiú. Bíonn na hinnill cuardaigh (Yahoo, Lycos, Google, Ask Jeeves) ag cuardach tríd an ngréasán an t-am ar fad, ag tógáil innéacsanna ábhar éagsúla — mar shampla, ag aimsiú teidil, fotheidil, eochairfhocail is céadlínte cáipéisí. Uaidh sin, is féidir cuid mhaith cáipéisí éagsúla ar ábhar ar leith a aisghabháil. Déanann an cuardach leanúnach cinnte de go bhfuil na hinnéacsanna suas chun dáta. Mar sin féin, aisghabhann na hinnill an-chuid cháipéisí nach mbaineann le hábhar, agus tá an-iarracht ar siúl an t-am ar fad iad a fheabhsú.", - "contributor": "unknown", "timestamp": "2013-10-27T18:17:00Z", "_type": "gawiki" } diff --git a/example/doc_glwiki_1.json b/example/doc_glwiki_1.json index f6b0feb..8d1e981 100644 --- a/example/doc_glwiki_1.json +++ b/example/doc_glwiki_1.json @@ -1,7 +1,6 @@ { "title_gl": "Motor de busca", "text_gl": "Un motor de busca ou buscador é un sistema informático que procura arquivos almacenados en servidores web, un exemplo son os buscadores de internet (algúns buscan só na Web pero outros buscan ademais en News, Gopher, FTP etc.) cando lles pedimos información sobre algún tema. As procuras fanse con palabras clave ou con árbores xerárquicas por temas; o resultado da procura é unha listaxe de direccións Web nas que se mencionan temas relacionados coas palabras clave buscadas.", - "contributor": "unknown", "timestamp": "2016-10-31T13:33:00Z", "_type": "glwiki" } diff --git a/example/doc_guwiki_1.json b/example/doc_guwiki_1.json index 32deec2..eb0cffd 100644 --- a/example/doc_guwiki_1.json +++ b/example/doc_guwiki_1.json @@ -1,7 +1,6 @@ { "title_gu": "વેબ શોધ એન્જીન", "text_gu": "વેબ શોધ એન્જિન એ વર્લ્ડ વાઈડ વેબ (World Wide Web) પર વિવિધ માહિતી શોધવા માટે ઉપયોગમાં લેવામાં આવે છે. શોધ લીસ્ટને સામાન્ય રીતે યાદીમાં દર્શાવવામાં આવે છે અને જેને સામાન્ય રીતે હીટ્સ કહેવામાં આવે છે. જે માહિતી મળે છે તેમાં વેબ પૃષ્ઠ (web page), છબીઓ, માહિતી અને અન્ય પ્રકારની ફાઈલો હોય છે. કેટલાક શોધ એન્જિનો ન્યુઝબુક, ડેટાબેઝ અને અન્ય પ્રકારની ઓપન ડીરેક્ટરી (open directories)ઓની વિગતો પણ આપે છે. વ્યકિતઓ દ્વારા દુરસ્ત થતી વેબ ડાયરેક્ટરીઝ (Web directories)થી અલગ રીતે, શોધ એન્જિન ઍલ્ગરિધમનો અથવા ઍલ્ગરિધમ (algorithmic) અને માનવીય બાબતોના મિક્ષણનો ઉપયોગ કરે છે.", - "contributor": "unknown", "timestamp": "2013-04-04T19:28:00Z", "_type": "guwiki" } diff --git a/example/doc_hiwiki_1.json b/example/doc_hiwiki_1.json index 9067a29..59456f8 100644 --- a/example/doc_hiwiki_1.json +++ b/example/doc_hiwiki_1.json @@ -1,7 +1,6 @@ { "title_hi": "खोज इंजन", "text_hi": "ऐसे कम्प्यूटर प्रोग्राम खोजी इंजन (search engine) कहलाते हैं जो किसी कम्प्यूटर सिस्टम पर भण्डारित सूचना में से वांछित सूचना को ढूढ निकालते हैं। ये इंजन प्राप्त परिणामों को प्रायः एक सूची के रूप में प्रस्तुत करते हैं जिससे वांछित सूचना की प्रकृति और उसकी स्थिति का पता चलता है। खोजी इंजन किसी सूचना तक अपेक्षाकृत बहुत कम समय में पहुँचने में हमारी सहायता करते हैं। वे 'सूचना ओवरलोड' से भी हमे बचाते हैं। खोजी इंजन का सबसे प्रचलित रूप 'वेब खोजी इंजन' है जो वर्ल्ड वाइड वेब पर सूचना खोजने के लिये प्रयुक्त होता है।", - "contributor": "unknown", "timestamp": "2017-10-19T20:09:00Z", "_type": "hiwiki" } diff --git a/example/doc_huwiki_1.json b/example/doc_huwiki_1.json index 7f2d784..d2595ec 100644 --- a/example/doc_huwiki_1.json +++ b/example/doc_huwiki_1.json @@ -1,7 +1,6 @@ { "title_hu": "Keresőmotor", "text_hu": "A keresőmotor az informatikában egy program vagy alkalmazás, amely bizonyos feltételeknek (többnyire egy szónak vagy kifejezésnek) megfelelő információkat keres valamilyen számítógépes környezetben. Ez a cikk a World Wide Weben (és esetleg az internet más részein, például a Useneten) kereső alkalmazásokról szól, a keresőmotor kifejezés önmagában általában ezekre vonatkozik. Másfajta keresőmotorokra példák a vállalati keresőmotorok, amik egy intraneten, és a személyi keresőmotorok, amik egy személyi számítógép állományai között keresnek.", - "contributor": "unknown", "timestamp": "2018-05-15T20:40:00Z", "_type": "huwiki" } diff --git a/example/doc_hywiki_1.json b/example/doc_hywiki_1.json index 007cbb6..4d9e1a2 100644 --- a/example/doc_hywiki_1.json +++ b/example/doc_hywiki_1.json @@ -1,7 +1,6 @@ { "title_hy": "Որոնողական համակարգ", "text_hy": "Որոնողական համակարգը գործիք է, որը նախատեսված է համապատասխան բառերով Համաշխարհային ցանցում որոնումներ կատարելու համար։ Ստեղծված է համացանցում և FTP սերվերներում ինֆորմացիա փնտրելու համար։ Փնտրված արդյունքները ընդհանրապես ներկայացվում են արդյունքների ցանկում և սովորաբար կոչվում են նպատակակակետ, հիթ։ Ինֆորմացիան կարող է բաղկացած լինել վեբ էջերից, նկարներից, ինֆորմացիաներից և այլ տիպի ֆայլերից ու տվյալներից։ Այն կարող է օգտագործվել տարբեր տեսակի տեղեկատվություն որոնելու համար, ներառյալ՝ կայքեր, ֆորումներ, նկարներ, վիդեոներ, ֆայլեր և այլն։ Որոշ կայքեր արդեն իրենցից ներկայացնում են ինչ-որ որոնողական համակարգ, օրինակ՝ Dailymotion, YouTube և Google Videos ինտերնետում տեղադրված տեսահոլովակների որոնողական կայքեր են։ Որոնողական կայքը բաղկացած է \"ռոբոտներից\", որոնց անվանում են նաև bot, spider, crawler, որոնք ավտոմատ կերպով, առանց մարդկային միջամտության պարբերաբար հետազոտում են կայքերը։ Որոնողական կայքերը հետևում են հղումներին, որոնք կապված լինելով իրար հետ ինդեքսավորում է յուրաքանչյուր էջ տվյալների բազայում՝ հետագայում բանալի բառերի օգնությամբ դառնալով հասանելի ինտերնետից օգտվողների համար։ Սխալմամբ, որոնողական կայքեր են անվանում նաև այն կայքերը, որոնք իրենցից ներկայացնում են կայքային տեղեկատուներ։ Այս կայքերում ուշադրության արժանի կայքերը ցուցակագրվում և դասակարգվում են մարդկային ռեսուրսների շնորհիվ, այլ ոչ թե բոտերի կամ ռոբետների միջոցով։ Այդ կայքերից կարելի է նշել օրինակ՝ Yahoo!։ Yahoo!-ի որոնողական կայքը գտնվում է այստեղ։ Բոլոր որոնողական համակարգերը նախատեսված են ինտերնետում որոնում իրականացնելու համար, սակայն կան որոշ որոնողական համակարգերի տարատեսակներ, որոնք համակարգչային ծրագրեր են և հետևաբար տեղակայվում են համակարգչի մեջ։ Այս համակարգերը կոչվում են desktop։ Վերջիներս հնարավորություն են տալիս որոնելու թե համակարգչի մեջ կուտակված ֆայլեը, թե կայքերում տեղադրված ռեսուրսները։ Այդ ծրագրերից ամենահայտնիներն են՝ Exalead Desktop, Copernic Desktop Search Գոյություն ունեն նաև մետա-որոնողական համակարգեր, այսինքն կայքեր, որ նույն որոնումը կատարում են միաժամանակ տարբեր որոնողական կայքերի միջնորդությամբ։ Որոնման արդյունքները հետո դասակարգվում են որպեսզի ներկայացվեն օգտագործողին։ Մետա-որոնողական համակարգերի շարքից կարելի է թվարկել օրինակ՝ Mamma և Kartoo։", - "contributor": "unknown", "timestamp": "2017-11-20T17:47:00Z", "_type": "hywiki" } diff --git a/example/doc_idwiki_1.json b/example/doc_idwiki_1.json index 7cf1b1e..262ebeb 100644 --- a/example/doc_idwiki_1.json +++ b/example/doc_idwiki_1.json @@ -1,7 +1,6 @@ { "title_id": "Mesin pencari web", "text_id": "Mesin pencari web atau mesin telusur web (bahasa Inggris: web search engine) adalah program komputer yang dirancang untuk melakukan pencarian atas berkas-berkas yang tersimpan dalam layanan www, ftp, publikasi milis, ataupun news group dalam sebuah ataupun sejumlah komputer peladen dalam suatu jaringan. Mesin pencari merupakan perangkat penelusur informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits. Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam jenis berkas seperti halaman situs web, gambar, ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga diketahui melakukan pengumpulan informasi atas data yang tersimpan dalam suatu basis data ataupun direktori web. Sebagian besar mesin pencari dijalankan oleh perusahaan swasta yang menggunakan algoritme kepemilikan dan basis data tertutup, di antaranya yang paling populer adalah safari Google (MSN Search dan Yahoo!). Telah ada beberapa upaya menciptakan mesin pencari dengan sumber terbuka (open source), contohnya adalah Htdig, Nutch, Egothor dan OpenFTS.", - "contributor": "unknown", "timestamp": "2017-11-20T17:47:00Z", "_type": "idwiki" } diff --git a/example/doc_itwiki_1.json b/example/doc_itwiki_1.json index 31d777f..c58fbfa 100644 --- a/example/doc_itwiki_1.json +++ b/example/doc_itwiki_1.json @@ -1,7 +1,6 @@ { "title_it": "Motore di ricerca", "text_it": "Nell'ambito delle tecnologie di Internet, un motore di ricerca (in inglese search engine) è un sistema automatico che, su richiesta, analizza un insieme di dati (spesso da esso stesso raccolti) e restituisce un indice dei contenuti disponibili[1] classificandoli in modo automatico in base a formule statistico-matematiche che ne indichino il grado di rilevanza data una determinata chiave di ricerca. Uno dei campi in cui i motori di ricerca trovano maggiore utilizzo è quello dell'information retrieval e nel web. I motori di ricerca più utilizzati nel 2017 sono stati: Google, Bing, Baidu, Qwant, Yandex, Ecosia, DuckDuckGo.", - "contributor": "unknown", "timestamp": "2018-07-16T12:20:00Z", "_type": "itwiki" } diff --git a/example/doc_jawiki_1.json b/example/doc_jawiki_1.json index de75dca..db74184 100644 --- a/example/doc_jawiki_1.json +++ b/example/doc_jawiki_1.json @@ -1,7 +1,6 @@ { "title_ja": "検索エンジン", "text_ja": "検索エンジン(けんさくエンジン、英語: search engine)は、狭義にはインターネットに存在する情報(ウェブページ、ウェブサイト、画像ファイル、ネットニュースなど)を検索する機能およびそのプログラム。インターネットの普及初期には、検索としての機能のみを提供していたウェブサイトそのものを検索エンジンと呼んだが、現在では様々なサービスが加わったポータルサイト化が進んだため、検索をサービスの一つとして提供するウェブサイトを単に検索サイトと呼ぶことはなくなっている。広義には、インターネットに限定せず情報を検索するシステム全般を含む。狭義の検索エンジンは、ロボット型検索エンジン、ディレクトリ型検索エンジン、メタ検索エンジンなどに分類される。広義の検索エンジンとしては、ある特定のウェブサイト内に登録されているテキスト情報の全文検索機能を備えたソフトウェア(全文検索システム)等がある。検索エンジンは、検索窓と呼ばれるボックスにキーワードを入力して検索をかけるもので、全文検索が可能なものと不可能なものとがある。検索サイトを一般に「検索エンジン」と呼ぶことはあるが、厳密には検索サイト自体は検索エンジンでない。", - "contributor": "unknown", "timestamp": "2018-05-30T00:52:00Z", "_type": "jawiki" } diff --git a/example/doc_knwiki_1.json b/example/doc_knwiki_1.json index 9bbdd86..cdd3ac0 100644 --- a/example/doc_knwiki_1.json +++ b/example/doc_knwiki_1.json @@ -1,7 +1,6 @@ { "title_kn": "ಅಂತರ್ಜಾಲ ಹುಡುಕಾಟ ಯಂತ್ರ", "text_kn": "ಅಂತರ್ಜಾಲ ಹುಡುಕಾಟ ಯಂತ್ರ ಎಂದರೆ World Wide Webನಲ್ಲಿ ಮಾಹಿತಿ ಹುಡುಕುವುದಕ್ಕಾಗಿ ವಿನ್ಯಾಸಗೊಳಿಸಲಾದ ಒಂದು ಸಾಧನ. ಹುಡುಕಾಟದ ಫಲಿತಾಂಶಗಳನ್ನು ಸಾಮಾನ್ಯವಾಗಿ ಒಂದು ಪಟ್ಟಿಯ ರೂಪದಲ್ಲಿ ಪ್ರಸ್ತುತಪಡಿಸಲಾಗುತ್ತದೆ ಮತ್ತು ಇವನ್ನು ’ಹಿಟ್ಸ್’ ಎಂದು ಕರೆಯಲಾಗುತ್ತದೆ. ಈ ಮಾಹಿತಿಯು ಅನೇಕ ಜಾಲ ಪುಟಗಳು, ಚಿತ್ರಗಳು, ಮಾಹಿತಿ ಹಾಗೂ ಇತರೆ ಕಡತಗಳನ್ನು ಹೊಂದಿರಬಹುದು. ಕೆಲವು ಹುಡುಕಾಟ ಯಂತ್ರಗಳು ಬೇರೆ ದತ್ತಸಂಚಯಗಳು ಅಥವಾ ಮುಕ್ತ ಮಾಹಿತಿ ಸೂಚಿಗಳಿಂದ ದತ್ತಾಂಶಗಳ ಗಣಿಗಾರಿಕೆ ಮಾಡಿ ಹೊರತೆಗೆಯುತ್ತವೆ. ಜಾಲ ಮಾಹಿತಿಸೂಚಿಗಳನ್ನು ಸಂಬಂಧಿಸಿದ ಸಂಪಾದಕರು ನಿರ್ವಹಿಸಿದರೆ, ಹುಡುಕಾಟ ಯಂತ್ರಗಳು ಗಣನಪದ್ಧತಿಯ ಮೂಲಕ ಅಥವಾ ಗಣನಪದ್ಧತಿ ಮತ್ತು ಮಾನವ ಹೂಡುವಳಿಯ ಮಿಶ್ರಣದ ಮುಖಾಂತರ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ.", - "contributor": "unknown", "timestamp": "2017-10-03T14:13:00Z", "_type": "knwiki" } diff --git a/example/doc_kowiki_1.json b/example/doc_kowiki_1.json index 11bb762..57ff513 100644 --- a/example/doc_kowiki_1.json +++ b/example/doc_kowiki_1.json @@ -1,7 +1,6 @@ { "title_cjk": "검색 엔진", "text_cjk": "검색 엔진은 컴퓨터 시스템에 저장된 정보를 찾아주는 것을 도와주도록 설계된 정보 검색 시스템이다. 이러한 검색 결과는 목록으로 표현되는 것이 보통이다. 검색 엔진을 사용하면 정보를 찾는데 필요한 시간을 최소화할 수 있다. 가장 눈에 띄는 형태의 공용 검색 엔진으로는 웹 검색 엔진이 있으며 월드 와이드 웹에서 정보를 찾아준다.", - "contributor": "unknown", "timestamp": "2017-11-19T12:50:00Z", "_type": "kowiki" } diff --git a/example/doc_mlwiki_1.json b/example/doc_mlwiki_1.json index 982dd0a..d172ff4 100644 --- a/example/doc_mlwiki_1.json +++ b/example/doc_mlwiki_1.json @@ -1,7 +1,6 @@ { "title_ml": "വെബ് സെർച്ച് എഞ്ചിൻ", "text_ml": "വേൾഡ് വൈഡ് വെബ്ബിലുള്ള വിവരങ്ങൾ തിരയാനുള്ള ഒരു ഉപാധിയാണ്‌ വെബ് സെർച്ച് എഞ്ചിൻ അഥവാ സെർച്ച് എഞ്ചിൻ. തിരച്ചിൽ ഫലങ്ങൾ സാധാരണായായി ഒരു പട്ടികയായി നൽകുന്നു, തിരച്ചിൽ ഫലങ്ങളെ ഹിറ്റുകൾ എന്നാണ്‌ വിളിച്ചുവരുന്നത്[അവലംബം ആവശ്യമാണ്]. തിരച്ചിൽ ഫലങ്ങളിൽ വെബ് പേജുകൾ, ചിത്രങ്ങൾ, വിവരങ്ങൾ, വെബ്ബിലുള്ള മറ്റ് ഫയൽ തരങ്ങൾ എന്നിവ ഉൾപ്പെടാം. അൽഗോരിതങ്ങൾ ഉപയോഗിച്ചാണ് സെർച്ച് എഞ്ചിനുകൾ പ്രവർത്തിക്കുന്നത്.", - "contributor": "unknown", "timestamp": "2010-05-05T15:06:00Z", "_type": "mlwiki" } diff --git a/example/doc_nlwiki_1.json b/example/doc_nlwiki_1.json index 5276fbc..d2ada6a 100644 --- a/example/doc_nlwiki_1.json +++ b/example/doc_nlwiki_1.json @@ -1,7 +1,6 @@ { "title_nl": "Zoekmachine", "text_nl": "Een zoekmachine is een computerprogramma waarmee informatie kan worden gezocht in een bepaalde collectie; dit kan een bibliotheek, het internet, of een persoonlijke verzameling zijn. Zonder nadere aanduiding wordt meestal een webdienst bedoeld waarmee met behulp van vrije trefwoorden volledige tekst (full text) kan worden gezocht in het gehele wereldwijde web. In tegenstelling tot startpagina's of webgidsen is er geen of zeer weinig menselijke tussenkomst nodig; het bezoeken van de webpagina's en het sorteren van de rangschikkingen gebeurt met behulp van een algoritme. Google is wereldwijd de meest gebruikte zoekmachine, andere populaire zoekmachines zijn Yahoo!, Bing en Baidu.", - "contributor": "unknown", "timestamp": "2018-05-07T11:05:00Z", "_type": "nlwiki" } diff --git a/example/doc_nowiki_1.json b/example/doc_nowiki_1.json index 4f5ae40..0b01a24 100644 --- a/example/doc_nowiki_1.json +++ b/example/doc_nowiki_1.json @@ -1,7 +1,6 @@ { "title_no": "Søkemotor", "text_no": "En søkemotor er en type programvare som leter frem informasjon fra Internett (nettsider eller andre nettressurser) eller begrenset til et datasystem, der informasjonen samsvarer med et gitt søk, og rangerer treffene etter hva den oppfatter som mest relevant. Typisk ligger søkemotoren tilgjengelig som et nettsted, der brukeren legger inn søkeord ev. sammen med filterinnstillinger, og treffene vises gjerne som klikkbare lenker. Søkemotoren kan enten gjøre søk på hele Internett (for eksempel Google, Bing, Kvasir og Yahoo!), innenfor et bestemt nettsted (for eksempel søk innenfor VGs nettavis), eller innenfor et bestemt tema (f.eks. Kelkoo, som søker etter priser på produkter, og Picsearch, som søker etter bilder). En bedrift kan også sette opp en intern bedrifts-søkemotor for å få enklere tilgang til alle dokumenter og databaser i bedriften.", - "contributor": "unknown", "timestamp": "2018-02-05T14:15:00Z", "_type": "nowiki" } diff --git a/example/doc_pswiki_1.json b/example/doc_pswiki_1.json index 9ae0102..b0ba67f 100644 --- a/example/doc_pswiki_1.json +++ b/example/doc_pswiki_1.json @@ -1,7 +1,6 @@ { "title_ps": "انټرنټ لټوونکی ماشين", "text_ps": "نټرنټ د معلوماتو يوه داسې پراخه نړۍ ده چې يوه پوله هم نه لري. هره ثانيه په زرگونو معلوماتي توکي په کې ورځای کېږي، خو بيا هم د ډکېدو کومه اندېښنه نه رامنځته کېږي. حيرانوونکې خبره بيا دا ده چې دغه ټول معلومات په داسې مهارت سره په دغه نړۍ کې ځای شوي دي، چې سړی يې د سترگو په رپ کې د نړۍ په هر گوټ کې ترلاسه کولای شي. د کيبورډ په يو دوو تڼيو زور کولو او د موږك په يو دوو کليکونو سره خپلو ټولو پوښتنو ته ځواب موندلای شئ. ټول معلومات په ځانگړو انټرنټ پاڼو کې خوندي وي، نو که سړي ته د يوې پاڼې پته معلومه وي نو سم له لاسه به دغه پاڼه د انټرنټ پاڼو په کتونکي پروگرام کې پرانيزي، خو که سړی بيا يو معلومات غواړي او د هغې پاڼې پته ورسره نه وي، چې دغه ځانگړي معلومات په كې ځای شوي دي، نو بيا سړی يوه داسې پياوړي ځواک ته اړتيا لري، چې د سترگو په رپ کې ټول انټرنټ چاڼ کړي او دغه ځانگړي معلومات راوباسي. له نېکه مرغه د دغه ځواک غم خوړل شوی دی او ډېرInternet Search Engine انټرنټ لټوونکي ماشينونه جوړ کړای شوي دي، چې په وړيا توگه ټول انټرنټ تر ثانيو هم په لږ وخت کې چاڼ کوي او زموږ د خوښې معلومات راښکاره کوي. دغو ماشينونو ته سړی يوه ځانگړې کليمه ورکوي او هغوی ټول انټرنټ په دغې وركړل شوې کلمې پسې لټوي او هر دقيق معلومات چې لاسته ورځي، نو د کمپيوټر پر پرده يې راښکاره کوي. د دغو ماشينونو په ډله کې يو پياوړی ماشين د Google په نوم دی. د نوموړي ماشين بنسټ په ١٩٩٨م کال کې د متحدو ايالاتو د Standford پوهنتون دوو محصلينو Larry Page او Sergey Brin کښېښود. د دغه ماشين خدمات سړی د www.google.com په انټرنټ پاڼه کې کارولای شي. نوموړی ماشين د نړۍ په گڼ شمېر ژبو باندې خدمات وړاندې کوي او داسې چټک او دقيق لټون کوي چې د انټرنټ نور ډېر غښتلي ماشينونه ورته گوته پر غاښ پاتې دي. گوگل په ټوله نړۍ کې کارول کېږي او تر نيمي ثانيي هم په لنډ وخت کې په ميليارډونو انټرنټ پاڼې چاڼ کوي او خپلو کاروونکو ته په پرتله ييزه توگه دقيق معلومات راباسي. گوگل په يوه ورځ کې څه كمُ ٢٠٠ ميليونه پوښتنې ځوابوي. دا ( گوگل) تورى خپله د يو امريکايي رياضيپوه د وراره له خوا په لومړي ځل د يوې لوبې لپاره کارول شوی و. هغه دغه تورى د يو سلو صفرونو ( 1000?.) غوندې لوی عدد ته د نوم په توگه کاراوه. دغه نوم د نوموړي شرکت د دغه توان ښكارندوى دى، چې په لنډ وخت کې په لويه کچه پوښتنو ته ځواب ورکوي او معلومات لټوي. سړی چې د گوگل چټکتيا او دقيقوالي ته ځير شي، نو دا پوښته راپورته کېږي چې د دې ماشين شا ته به څومره پرمختللي کمپيوټرونه او پياوړی تخنيک پټ وي. خو اصلاً د گوگل شا ته په يوه لوی جال کې د منځنۍ بيې کمپيوټرونه سره نښلول شوي دي . په دې توگه په زرگونو کمپيوټرونه هممهاله په کار بوخت وي، چې په ترڅ کې يې د معلوماتو لټول او چاڼ کول چټکتيا مومي. د يوې پوښتنې له اخيستلو څخه راواخله معلوماتو تر لټولو او بيا د دقيقوالي له مخې په يوه ځانگړي طرز بېرته کاروونکي يا پوښتونكي تر ښوولو پورې ټولې چارې د درېيو Software پروگرامونه په لاس کې دي، چې په دغه زرگونو کمپيوټرونو کې ځای پر ځای شوي دي.", - "contributor": "unknown", "timestamp": "2015-12-15T18:53:00Z", "_type": "pswiki" } diff --git a/example/doc_ptwiki_1.json b/example/doc_ptwiki_1.json index affca77..8fb25c4 100644 --- a/example/doc_ptwiki_1.json +++ b/example/doc_ptwiki_1.json @@ -1,7 +1,6 @@ { "title_pt": "Motor de busca", "text_pt": "Motor de pesquisa (português europeu) ou ferramenta de busca (português brasileiro) ou buscador (em inglês: search engine) é um programa desenhado para procurar palavras-chave fornecidas pelo utilizador em documentos e bases de dados. No contexto da internet, um motor de pesquisa permite procurar palavras-chave em documentos alojados na world wide web, como aqueles que se encontram armazenados em websites. Os motores de busca surgiram logo após o aparecimento da Internet, com a intenção de prestar um serviço extremamente importante: a busca de qualquer informação na rede, apresentando os resultados de uma forma organizada, e também com a proposta de fazer isto de uma maneira rápida e eficiente. A partir deste preceito básico, diversas empresas se desenvolveram, chegando algumas a valer milhões de dólares. Entre as maiores empresas encontram-se o Google, o Yahoo, o Bing, o Lycos, o Cadê e, mais recentemente, a Amazon.com com o seu mecanismo de busca A9 porém inativo. Os buscadores se mostraram imprescindíveis para o fluxo de acesso e a conquista novos visitantes. Antes do advento da Web, havia sistemas para outros protocolos ou usos, como o Archie para sites FTP anônimos e o Veronica para o Gopher (protocolo de redes de computadores que foi desenhado para indexar repositórios de documentos na Internet, baseado-se em menus).", - "contributor": "unknown", "timestamp": "2017-11-09T14:38:00Z", "_type": "ptwiki" } diff --git a/example/doc_rowiki_1.json b/example/doc_rowiki_1.json index 4929dbc..ca80608 100644 --- a/example/doc_rowiki_1.json +++ b/example/doc_rowiki_1.json @@ -1,7 +1,6 @@ { "title_ro": "Motor de căutare", "text_ro": "Un motor de căutare este un program apelabil căutător, care accesează Internetul în mod automat și frecvent și care stochează titlul, cuvinte cheie și, parțial, chiar conținutul paginilor web într-o bază de date. În momentul în care un utilizator apelează la un motor de căutare pentru a găsi o informație, o anumită frază sau un cuvânt, motorul de căutare se va uita în această bază de date și, în funcție de anumite criterii de prioritate, va crea și afișa o listă de rezultate (engleză: hit list ).", - "contributor": "unknown", "timestamp": "2018-06-12T08:59:00Z", "_type": "rowiki" } diff --git a/example/doc_ruwiki_1.json b/example/doc_ruwiki_1.json index 5a9ec23..3733d50 100644 --- a/example/doc_ruwiki_1.json +++ b/example/doc_ruwiki_1.json @@ -1,7 +1,6 @@ { "title_ru": "Поисковая машина", "text_ru": "Поисковая машина (поиско́вый движо́к) — комплекс программ, предназначенный для поиска информации. Обычно является частью поисковой системы. Основными критериями качества работы поисковой машины являются релевантность (степень соответствия запроса и найденного, т.е. уместность результата), полнота индекса, учёт морфологии языка.", - "contributor": "unknown", "timestamp": "2017-03-22T01:16:00Z", "_type": "ruwiki" } diff --git a/example/doc_svwiki_1.json b/example/doc_svwiki_1.json index 07997b5..43f56cb 100644 --- a/example/doc_svwiki_1.json +++ b/example/doc_svwiki_1.json @@ -1,7 +1,6 @@ { "title_sv": "Söktjänst", "text_sv": "En söktjänst är en webbplats som gör det möjligt att söka efter innehåll på Internet. Söktjänsterna använder sökmotorer, även kallade sökrobotar, för att upptäcka, hämta in och indexera webbsidor.", - "contributor": "unknown", "timestamp": "2018-08-16T22:13:00Z", "_type": "svwiki" } diff --git a/example/doc_tawiki_1.json b/example/doc_tawiki_1.json index 563f0a6..5f46729 100644 --- a/example/doc_tawiki_1.json +++ b/example/doc_tawiki_1.json @@ -1,7 +1,6 @@ { "title_ta": "தேடுபொறி", "text_ta": "தேடுபொறி அல்லது தேடற்பொறி என்பது ஒரு கணினி நிரலாகும். இது இணையத்தில் குவிந்து கிடக்கும் தகவல்களில் இருந்தோ கணினியில் இருக்கும் தகவல்களில் இருந்தோ நமக்குத் தேவையான தகவலைப்பெற உதவுகின்றது. பொதுவாகப் பாவனையாளர்கள் ஒரு விடயம் சம்பந்தமாகத் தேடுதலை ஒரு சொல்லை வைத்து தேடுவார்கள். தேடுபொறிகள் சுட்டிகளைப் பயன்படுத்தி விரைவான தேடலை மேற்கொள்ளும். தேடுபொறிகள் என்பது பொதுவாக இணையத் தேடுபொறிகளை அல்லது இணையத் தேடற்பொறிகளையே குறிக்கும். வேறுசில தேடுபொறிகள் உள்ளூர் வலையமைப்பை மாத்திரமே தேடும். இணைய தேடு பொறிகள் பல பில்லியன் பக்கங்களில் இருந்து நமக்குத் தேவையான மிகப் பொருத்தமான பக்கங்களைத் தேடித் தரும். வேறுசில தேடற்பொறிகள் செய்திக் குழுக்கள், தகவற்தளங்கள், திறந்த இணையத்தளங்களைப் பட்டியலிடும் DMOZ.org போன்ற இணையத் தளங்களைத் தேடும். மனிதர்களால் எழுதப்பட்ட இணையத் தளங்களைப் பட்டியலிடும் தளங்களைப் போன்றல்லாது தேடு பொறிகள் அல்காரிதங்களைப் பாவித்துத் தேடல்களை மேற்கொள்ளும். வேறு சில தேடற்பொறிகளோ தமது இடைமுகத்தை வழங்கினாலும் உண்மையில் வேறுசில தேடுபொறிகளே தேடலை மேற்கொள்ளும். ஆரம்ப காலத்தில் ASCII முறை வரியுருக்களை கொண்டே தேடு சொற்களை உள்ளிட முடிந்தது. தற்போது ஒருங்குறி எழுத்துக்குறிமுறையை பல தேடுபொறிகளும் ஆதரிப்பதால் ஆங்கிலத்தில் மட்டுமல்லாது உலக மொழிகள் அனைத்திலும் அவ்வம் மொழிப்பக்கங்களை தேடிப்பெறக்கூடியதாகவுள்ளது.", - "contributor": "unknown", "timestamp": "2017-12-24T10:30:00Z", "_type": "tawiki" } diff --git a/example/doc_tewiki_1.json b/example/doc_tewiki_1.json index 91929cd..b014c8f 100644 --- a/example/doc_tewiki_1.json +++ b/example/doc_tewiki_1.json @@ -1,7 +1,6 @@ { "title_te": "వెబ్ శోధనా యంత్రం", "text_te": "వెబ్ శోధన యంత్రం అనేది వరల్డ్ వైడ్ వెబ్/ప్రపంచ వ్యాప్త వెబ్లో సమాచారాన్ని శోదించటానికి తయారుచేసిన ఒక సాధనం. శోధన ఫలితాలు సాధారణంగా ఒక జాబితాలో ఇవ్వబడతాయి మరియు అవి సాధారణంగా హిట్స్ అని పిలువబడతాయి. ఆ సమాచారం వెబ్ పేజీలు, చిత్రాలు, సమాచారం మరియు ఇతర రకాలైన జాబితాలను కలిగి ఉంటుంది.కొన్ని శోధనా యంత్రాలు డేటా బేస్ లు లేదా ఓపెన్ డైరెక్టరీలలో అందుబాటులో ఉన్న సమాచారాన్ని కూడా వెలికితీస్తాయి. మానవ సంపాదకులచే నిర్వహించబడే క్రమపరిచిన వెబ్ డైరెక్టరీల లా కాకుండా, శోధనా యంత్రాలు సమస్య పరిష్కారానికి ఉపయోగించే ఒక క్రమ పద్దతి ద్వారా లేదా సమస్య పరిష్కారానికి ఉపయోగించే ఒక క్రమ పద్దతి మరియు మానవ శక్తిల మిశ్రమంతో పనిచేస్తాయి.", - "contributor": "unknown", "timestamp": "2017-06-19T11:22:00Z", "_type": "tewiki" } diff --git a/example/doc_thwiki_1.json b/example/doc_thwiki_1.json index f3aa444..81a233f 100644 --- a/example/doc_thwiki_1.json +++ b/example/doc_thwiki_1.json @@ -1,7 +1,6 @@ { "title_th": "เสิร์ชเอนจิน", "text_th": "เสิร์ชเอนจิน (search engine) หรือ โปรแกรมค้นหา คือ โปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบนอินเทอร์เน็ต โดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย. เสิร์ชเอนจินส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญ (คีย์เวิร์ด) ที่ผู้ใช้ป้อนเข้าไป จากนั้นก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมา ในปัจจุบัน เสิร์ชเอนจินบางตัว เช่น กูเกิล จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป", - "contributor": "unknown", "timestamp": "2016-06-18T11:06:00Z", "_type": "thwiki" } diff --git a/example/doc_trwiki_1.json b/example/doc_trwiki_1.json index b5e3ee6..bedbd13 100644 --- a/example/doc_trwiki_1.json +++ b/example/doc_trwiki_1.json @@ -1,7 +1,6 @@ { "title_tr": "Arama motoru", "text_tr": "Arama motoru, İnternet üzerinde bulunan içeriği aramak için kullanılan bir mekanizmadır. Üç bileşenden oluşur: web robotu, arama indeksi ve kullanıcı arabirimi. Ancak arama sonuçları genellikle sık tıklanan internet sayfalarından oluşan bir liste olarak verilmektedir.", - "contributor": "unknown", "timestamp": "2018-03-13T17:37:00Z", "_type": "trwiki" } diff --git a/example/doc_zhwiki_1.json b/example/doc_zhwiki_1.json index 4c5a761..f997795 100644 --- a/example/doc_zhwiki_1.json +++ b/example/doc_zhwiki_1.json @@ -1,7 +1,6 @@ { "title_zh": "搜索引擎", "text_zh": "搜索引擎(英语:search engine)是一种信息检索系统,旨在协助搜索存储在计算机系统中的信息。搜索结果一般被称为“hits”,通常会以表单的形式列出。网络搜索引擎是最常见、公开的一种搜索引擎,其功能为搜索万维网上储存的信息.", - "contributor": "unknown", "timestamp": "2018-08-27T05:47:00Z", "_type": "zhwiki" } diff --git a/example/index_mapping.json b/example/index_mapping.json index d3d514f..ac7c43b 100644 --- a/example/index_mapping.json +++ b/example/index_mapping.json @@ -34,7 +34,7 @@ ], "default_analyzer": "ar" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -114,7 +114,7 @@ ], "default_analyzer": "bg" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -194,7 +194,7 @@ ], "default_analyzer": "ca" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -274,7 +274,7 @@ ], "default_analyzer": "cs" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -354,7 +354,7 @@ ], "default_analyzer": "da" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -434,7 +434,7 @@ ], "default_analyzer": "de" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -514,7 +514,7 @@ ], "default_analyzer": "el" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -594,7 +594,7 @@ ], "default_analyzer": "en" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -674,7 +674,7 @@ ], "default_analyzer": "es" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -754,7 +754,7 @@ ], "default_analyzer": "fa" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -834,7 +834,7 @@ ], "default_analyzer": "fi" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -914,7 +914,7 @@ ], "default_analyzer": "fr" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -994,7 +994,7 @@ ], "default_analyzer": "ga" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1074,7 +1074,7 @@ ], "default_analyzer": "gl" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1154,7 +1154,7 @@ ], "default_analyzer": "in" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1234,7 +1234,7 @@ ], "default_analyzer": "hi" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1314,7 +1314,7 @@ ], "default_analyzer": "hu" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1394,7 +1394,7 @@ ], "default_analyzer": "hy" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1474,7 +1474,7 @@ ], "default_analyzer": "id" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1554,7 +1554,7 @@ ], "default_analyzer": "it" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1634,7 +1634,7 @@ ], "default_analyzer": "ja" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1714,7 +1714,7 @@ ], "default_analyzer": "in" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1794,7 +1794,7 @@ ], "default_analyzer": "cjk" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1874,7 +1874,7 @@ ], "default_analyzer": "in" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -1954,7 +1954,7 @@ ], "default_analyzer": "nl" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2034,7 +2034,7 @@ ], "default_analyzer": "no" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2114,7 +2114,7 @@ ], "default_analyzer": "ckb" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2194,7 +2194,7 @@ ], "default_analyzer": "pt" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2274,7 +2274,7 @@ ], "default_analyzer": "ro" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2354,7 +2354,7 @@ ], "default_analyzer": "ru" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2434,7 +2434,7 @@ ], "default_analyzer": "sv" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2514,7 +2514,7 @@ ], "default_analyzer": "in" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2594,7 +2594,7 @@ ], "default_analyzer": "in" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2674,7 +2674,7 @@ ], "default_analyzer": "th" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2754,7 +2754,7 @@ ], "default_analyzer": "tr" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [ @@ -2834,7 +2834,7 @@ ], "default_analyzer": "cjk" }, - "contributor": { + "url": { "enabled": true, "dynamic": true, "fields": [