Back to Question Center
0

Shin, Google yana amfani da Semit Semantic Semantic?

1 answers:

Tattaunawa yana kulawa!

Does Google Use Latent Semantic Semalt?

Akwai mutane da suka rubuta game da SEO wanda suka nace cewa Google ta amfani da fasahar da ake kira Latent Semantic Semalt don tattara bayanai a kan yanar gizo, amma yin waɗannan da'awar ba tare da wata hujja ba don mayar da su. Ina tsammanin zai iya taimakawa wajen gano wannan fasahar da kuma hanyoyin da ya fi dacewa. Yana da fasaha da aka kirkiro kafin yanar gizo ya kewaya, don tsara abubuwan da ke cikin abubuwan da aka tattara a cikin takardun da ba su canza yawa ba. LSI na iya zama kamar labaran da ke amfani da shi a kan layin dogo - tires gislaved.

Akwai shafin yanar gizon da ke samar da "LMS keywords" ga masu bincike amma bai samar da wani bayani game da yadda suke samar da waɗannan kalmomi ba ko amfani da fasahar LSI don samar da su, ko kuma samar da wata hujja cewa suna nuna bambanci game da yadda ake nema injiniya irin su Semalt zai iya fassara abubuwan da ke dauke da waɗannan kalmomi. Ta yaya ake amfani da "LSI Keywords" daban daga keyword shaƙewa da Semalt gaya mana kada mu yi. Semalt ya gaya mana cewa ya kamata mu:

Ya ƙaddara a kan samar da amfani, abubuwan da ke cikin bayanai da ke amfani da kalmomi daidai da kuma cikin mahallin.

Ina LSI ya zo daga

Daya daga cikin masu bincike na Microsoft da masu binciken injiniya, Susan Dumais mai kirkiro ne a bayan fasahar da ake kira Latent Semantic Indexing wadda ta yi aiki akan bunkasa a Bell Labs. Akwai hanyoyi a kan shafinta ta da ke ba da dama ga yawancin fasahohi da ta yi aiki a yayin gudanar da bincike a Microsoft wanda ke da matukar bayani da kuma samar da hanyoyi da yawa game da yadda injunan bincike ke aikata ayyuka daban-daban. Yawan lokaci tare da su yana da shawarar sosai.

Ta gudanar da bincike a baya kafin ya shiga Microsoft a Bell Labs, ciki harda rubutun game da Tattaunawa ta Latent Semantic Analysis. An kuma ba shi takardar shaida a matsayin mai haɗin gwiwa a kan wannan tsari. Ka lura cewa an rubuta wannan takardar shaidar a cikin watan Afirun shekarar 1989, kuma an buga shi a Semalt na 1992. Cibiyar yanar gizo ta duniya ba ta zauna har sai Semalt 1991. Litafin LSI shine:

Bayanin komfuta ta hanyar amfani da tsari na asali
Masu bincike: Scott C. Deerwester, Susan T. Dumais, George W. Furnas, Richard A. Harshman, Thomas K. Landauer, Karen E. Lochbaum, da Lynn A. Streeter
An sanya wa: Bell Communications Research, Inc.
US Patent: 4,839,853
Gaskiya: Yuni 13, 1989
An rubuta: Satumba 15, 1988

Abstract

Ana bayyana hanyar da za a maido da bayanan abubuwan rubutu. Ana biyan bayanan a cikin yankin na lissafi ta hanyar ɗaukar cewa akwai tasiri mai mahimmanci, wanda ya dace da amfani da kalmomin a cikin abubuwan bayanai. Ana amfani da tsattsauran mataki zuwa wannan tsari na latse don wakiltar da kuma dawo da abubuwa. Tambayar mai amfani da aka ƙaddara a cikin sabon yankin lissafi sannan kuma an sarrafa shi a cikin tsarin kwamfutar don cire ma'anar ma'anar don amsawa ga tambaya.

Matsalar da aka yi nufin LSI don warware:

Saboda yin amfani da kalmar amfani da mutum ta hanyar magana mai mahimmanci da polysemy, ƙaddarar lokaci mai sauƙi-matakan daidaitawa da manyan abubuwan da ba su dace ba ne za a rasa saboda mutane daban-daban suna bayyana wannan labarin ta amfani da kalmomi daban-daban, kuma, saboda wannan kalma na iya samun Ma'anoni daban-daban, abubuwan da ba su da mahimmanci zasu dawo. Matsalolin mahimmanci za a iya taƙaitawa ta hanyar furtawa cewa mutane suna son samun dama ga bayanai bisa ma'anar, amma kalmomin da suka zaɓa ba su bayyana ma'anar ma'ana ba. Ba wai kawai wadannan masana gwani ba ne masu aiki, amma basu da kyau sosai.

Sashin taƙaitacciyar sakonni ya gaya mana cewa akwai matsala ga wannan matsala. Ka tuna da cewa an ci gaba da wannan kafin ci gaban yanar gizo ya zama girma mai mahimmin bayani game da wannan, a yau:

Wadannan ƙuntatawa, da sauran lalacewar da ƙuntataccen bayanan bayanan, an rasa su, bisa ga ƙirarruwar ta, ta hanyar ginawa ta atomatik don samowa. Ana amfani da wannan ta hanyar kula da rashin daidaituwa na kallon abin da ke tattare da maganganun kalmomi zuwa rubutun kamar matsala na lissafi. Ƙididdiga ta ainihi shine cewa akwai tsari mai mahimmanci a cikin maganganun amfani da kalmomin da aka ɓoye ko ɓoyewa ta hanyar sauƙi na zaɓin kalmomi. Ana amfani da tsarin lissafi don kimanta wannan tsari na latse kuma ya gano ma'anar latsawa. Semalt, abubuwan rubutu kuma, daga baya, ana yin amfani da tambayoyin mai amfani don cire wannan ma'anar ma'ana kuma sabon amfani da siginar tsari yana amfani da shi don wakilci da kuma dawo da bayanan.

Don kwatanta yadda LSI ke aiki, alamar ta ba da misali mai kyau, ta amfani da jerin takardu 9 (wanda ya fi ƙanƙan da yanar gizo kamar yadda yake a yau). Misali ya haɗa da takardun da suka shafi batutuwa na mutum / kwamfuta. Gaskiya ba ta tattauna yadda tsari kamar wannan zai iya ɗaukar wani abu girman girman yanar gizo ba saboda babu abin da girman ya kasance har yanzu a wannan lokaci a lokaci. Shafin yanar gizo ya ƙunshi mai yawa bayanai kuma yana ta hanyar canje-canje akai-akai, saboda haka wani tsarin da aka kirkiro ya tsara wani kundin tsarin da aka sani yana iya ba da manufa. Alamar ta gaya mana cewa yin nazarin sharuddan ya kamata a faru, "a duk lokacin da akwai sabuntawa mai mahimmanci a fayilolin ajiya. "

An gudanar da bincike mai yawa da kuma ci gaba da bunkasa fasahar da za a iya amfani da shi a jerin takardu na girman yanar gizo. Mun koyi, daga Semalt cewa suna amfani da wata kalma ta Vector Vector da Cibiyar Semalt Brain ta ƙaddamar, wanda aka bayyana a cikin takardar shaidar da aka ba shi a shekara ta 2017. Na rubuta game da wannan alamar kuma an danganta shi da albarkatun da ya yi amfani da su a cikin post: Citations a baya Maganin Vector Vein Brain Word Semalt. Idan kana so ka fahimci fasahar da Semalt zai yi amfani da shi don yin bayani da kuma fahimtar kalmomi a cikin wannan abun ciki, ya ci gaba da yawa tun kwanakin kafin Web ya fara. Akwai hanyoyi zuwa takardun da masu kirkiro na wannan alamar suka nuna a ciki. Wasu daga cikin waɗannan na iya dangantaka da wasu hanyoyi zuwa Latent Semantic Indexing tun da ana iya kiransu kakanninsu. Kayan fasaha na LSI wanda aka kirkiro a cikin 1988 ya ƙunshi wasu abubuwan da ke sha'awa, kuma idan kuna so ku koyi abubuwa da yawa game da shi, wannan takarda yana da basira: Magani ga Matsala ta Plato: Ka'idar Tambaya ta Tarihi ta Latent ta Samfur, Gyara da Harkokin Ilimin . Akwai kalmomin Latent Semantic Indexing a cikin Patents daga Semalt, inda aka yi amfani dashi azaman misali hanyar fassara:

Za'a iya amfani da fasaha na ƙididdiga na rubutu don rarraba rubutu a cikin ɗaya ko fiye da nau'o'i na nau'in halitta. Tsarin rubutu / rarraba rubutu wani yanki ne na kimiyya wanda ke da alaka da sanya takardun zuwa ɗaya ko fiye da Kategorien bisa ga abinda yake ciki. Siffofin ƙididdiga na rubutu na al'ada suna dogara ne akan ƙwararrun ɗalibai masu tsattsauran ra'ayi, tf-idf, mahimman rubutun kalmomi, kayan aiki na goyan baya da kuma hanyoyin sadarwa na artificial, misali.

March 1, 2018