Forum mühərrikinin avtomatik aşkarlanması. Axtarış motorunun optimallaşdırılmasında ilk addımlar Sadə Maşınlar Forumu: müəllif hüquqları və xarici bağlantıların silinməsi Mən smf tərəfindən dəstəklənən php mövzu indeksini tələb edirəm
Botmaster Labs tərəfindən təşkil edilib, planlaşdırılmayıb. Vaxtım yoxdur, video yeni bir tendensiya kimi müsabiqə üçün lazımdır, baxmayaraq ki, hər şeyi yaxşı ekran görüntüləri ilə daha asan izah etmək olar (mənim IMHO) və mən heç nə çəkmək istəmirəm. Çox az qazanclı mövzu qalıb, axmaq spam artıq hökmranlıq etmir, burada düşünmək lazımdır və köhnəlmişləri gözəl bir qablaşdırmaya qoyub bir az tozlandırmağa çalışmasanız, mövzuları heç kim çəkməyəcək. :) Amma bu bizim haqqımızda deyil. Ümumiyyətlə, bu 3 “edilməz şey”, məncə, potensial iştirakçıların əksəriyyəti üçün müsabiqədə iştirak etmək üçün əsas maneə oldu. Bu, üçdən bir avtomobili təmir etmək kimidir: ucuz, yüksək keyfiyyətli, sürətli - xidmət eyni vaxtda yalnız 2 şərti yerinə yetirə bilər. oturun və sizə daha yaxın olanı seçin. :) Yarışmada da belədir: vaxtım var, video çəkməyi bilirəm, amma mövzu yoxdur, ya da video çəkməyi bilirəm, mövzu var, amma vaxtım yoxdur hamisi yoxsa asude vaxtim var ve balaca tema var amma video qorxuludur. Ancaq 2 şərt eyni vaxtda yerinə yetirilərsə, bu yaxşıdır. Yaxşı, tamam, mahnının sözlərini ataq. Özümə davam edəcəm. Mən planlaşdırmadım, yəni müsabiqədə iştirak etdim, hətta hansı məqaləyə səs verəcəyimi də seçdim. Nə desəniz, Doz proqramı çox yaxşı bilir və ondan çox ağıllı şəkildə istifadə etməyi bilir. Amma bu gün öyrəndim ki, müsabiqədə intriqa yaranıb. Belə çıxır ki, mən səs verə bilməyəcəm və yalnız 2011-ci ildə proqramı almış yeni gələnlər bunu edə biləcəklər və müsabiqə onlar üçün nəzərdə tutulub. Bir az təəccübləndim, amma sahibi centlmendir. Müsabiqə bir reklam kampaniyasıdır və İskəndər bunu necə həyata keçirəcəyini daha yaxşı bilir. Ümumiyyətlə, mən o zaman məqalə yerləşdirmək qərarına gəldim ki, kimin üçün, bütün kolxoz üçün, əslində, bunu etmək mümkün olmadığı halda yazmaq bir qədər asandır; Uzun giriş başa çatdı, indi nöqtəyə. Xrumer + Hrefer kompleksi olan belə bir superkombayn alan yeni başlayana nə lazımdır? Düzdü, bunun üzərində necə işləməyi öyrənin və vərəqləri spamlamağa başlayaraq pul qazana biləcəyiniz illüziyasından imtina edin. Əgər belə düşünürsənsə, yaxşı olar ki, pulunu dərhal xeyriyyəçiliyə bağışla. Kompleksin alətlərindən necə istifadə edəcəyinizi öyrənməlisiniz, tercihen özünüz üçün kəskinləşdirin. "Daha çox götür - daha da at" vaxtı keçdi. Kəmiyyət yerini keyfiyyətə verir. Bu o deməkdir ki, biz özümüz üçün baza yığacağıq, əgər bunu necə edəcəyinizi öyrənməsəniz, qatarın arxasına düşəcəksiniz. Təbii ki, Khrefer bu işdə bizə kömək edəcək. Əgər siz öz resurslarınızı Google-da tanıtmağı planlaşdırırsınızsa, o zaman biz də Google vasitəsilə donor saytları axtarmalıyıq. Məncə, bu başa düşüləndir və məntiqlidir. Lakin Google, mis dağın məşuqəsi kimi, sərvətini hamıya vermir. Buna bir yanaşma lazımdır. Dərhal demək istərdim ki, ictimaiyyətdə tapdığınız əlamətlərə əsaslanaraq bir şey toplaya biləcəyinizə ümid etməyin. Onların ictimaiyyətə təqdim edilməsinin səbəbi dəyərsiz olmalarıdır. Mövzunu daha da inkişaf etdirməyəcəm. Nəticəni görmək üçün onu necə düzgün yığmaq lazım olduğunu söyləmək daha yaxşıdır, qalanını özünüz həll edə bilərsiniz, əsas odur ki, prinsipi başa düşəsiniz. Biz ümumiyyətlə forumların xüsusiyyətlərinə deyil, bizə lazım olan xüsusi mühərriklərin xüsusiyyətlərinə əsaslanaraq düzgün olanları toplamaq lazımdır. Bu, yeni başlayanların əsas səhvidir - diqqəti konkret bir şeyə cəmləmək deyil, hər şeyi bütövlükdə əhatə etməyə çalışmaqdır. Həmçinin, əgər siz az-çox normal verilənlər bazasını təhlil etmək istəyirsinizsə, sorğularda operatorlardan istifadə etməyi dayandırın. "inurl:", "sayt:", "title" və s. Google sizin kimi axtarış edənləri dərhal qadağan edəcək. Buna görə də Khrumer-in hazırda işlədiyi mühərrikləri diqqətlə öyrənirik:
Php-Fusion ilə təchiz edilmişdir
Khrumer 7.07 versiyasında proqram bir neçə yeni mühərrikdə öyrədilir:
forumi.biz, forumb.biz, 1forum.biz, 7forum.biz və s.
phpBB-fr.com, Solaris phpBB mövzusu
Və yeni şeylər öyrənmək prosesi davamlıdır. Ümumiyyətlə, Hrefer tərəfindən təhlil üçün düzgün sorğular hazırlamalıyıq. Nümunə olaraq dizhok forumunu götürək. SMF Forumları. Və onu təhlil üçün hissələrə ayırmağa başlayaq. Sevimli Google bu işdə bizə kömək edəcək. Google-a sorğu daxil edin SMF Forumları- axtarış nəticələrində çoxlu zibil var, biz 13-cü səhifəyə qayıdırıq və istənilən linki seçirik. Buna rast gəldim: http://www.volcanohost.com/forum/index.php?topic=11.0. Gəlin onu açıb öyrənək. Bu mühərrikdə digər səhifələrin axtarışına tətbiq oluna bilən səhifədə xarakterik bir şey tapmalıyıq. Altbilgidə aşağıdakı yazıya diqqət yetiririk SMF 1.1.14 ilə təchiz edilmişdir, sitat gətirin və Google-a daxil edin, bu bizə göstərir ki, bu sorğu üçün təxminən 59 milyon seçim bilir. Bağlantıları tez bir zamanda nəzərdən keçiririk, bu açar sözə daha bir neçə seçim əlavə edirik, məsələn, "Powered by SMF 1.1.14" qovaq və ya "Powered by SMF 1.1.14" viagra. Biz sorğunun böyük olduğuna əminik, nəticələr yalnız forumlardır və demək olar ki, heç bir zibil yoxdur.
Bundan əlavə, bizi kəmiyyət yox, yuxarıda dediyim kimi keyfiyyət maraqlandırır. Davam et. Eyni forumdan altbilgidən başqa bir ifadə alırıq: , biz də ondan sitat gətiririk və Google-a veririk. Cavabında o, 13 milyondan çox nəticə bildiyini açıqlayır. Yenə biz tez nəticələrə baxırıq, əlavə sözlər əlavə edirik və nəticələri onlarla yoxlayırıq. Sorğunun əla olduğuna və demək olar ki, heç bir zibil olmadığına əminik. Ümumiyyətlə, artıq 2 dəmir sorğusu var. Mən hələlik birinci forumu tək buraxmağı və digər forumlardan sorğu toplamağa davam etməyi təklif edirəm. Xoşbəxtlikdən, sorğu əsasında Google-u açırıq. 2006-2008, Simple Machines MMC. Biz axtarış nəticələrindən, məsələn, bu forumları götürürük: http://www.snowlinks.ru/forum/index.php?topic=1062.0 və http://litputnik.ru/forum/index.php?action=printpage ;topic=380.0 altbilgilərdə biz onlardan aşağıdakı sorğuları alırıq: “Powered by SMF 1.1.7” və “Powered by SMF 1.1.10” (Hrefer üçün sorğuları həmişə dırnaq içərisində daxil etməyi məsləhət görürəm, çünki bizə ilk növbədə keyfiyyət lazımdır. hamısı). Düşünürəm ki, nə etdiyimiz aydındır, sonda SMF mühərrikində forumları axtarmaq üçün müəyyən bir sorğu bazasına sahib olacağıq (məsələn, digər mühərriklərdə olduğu kimi seçilmişdir). Bu kimi bir şey görünəcək:
"SMF 1.1.2 tərəfindən dəstəklənir"
"SMF 1.1.3 tərəfindən dəstəklənir"
"SMF 1.1 RC2 ilə təchiz edilmişdir"
"SMF 1.1.4 tərəfindən dəstəklənir"
"SMF 1.1.8 tərəfindən dəstəklənir"
"SMF 1.1.7 tərəfindən dəstəklənir"
"2006-2008, Simple Machines MMC"
Və bu hamısı deyil. Mühərrik versiyalarını toplayarkən, bəzi SMF forumlarında altbilgidə “2001-2006, Lewis Media” başlığına rast gəlirik. Biz bu sorğunu yoxlayırıq, o da bizi tam qane edir. Bənzər bir sorğu tapırıq: "2001-2005, Lewis Media". Altbilgilərə daha ətraflı baxaraq, aşağıdakı sorğunu tapırıq: "SMFone dizaynı A.M.A, SMF 1.1-ə daşınıb". Yoxlayırıq - əla. Və s. Yarım saatlıq iş və sizin mühərrik üçün gözəl sorğular bazanız var və Google bu sorğular üçün sizə operatorlardan istifadə etdiyinizdən daha az qadağa qoyacaq. Eyni zamanda, verilənlər bazanız “index.php?topic=" kimi sorğulardan istifadə etdiyinizdən daha təmiz olacaq, çünki burada Google yalnız bizə lazım olan forumları deyil, həm də mümkün olduğu yerlərdə bir çox sol mənbələri verəcəkdir. forum mövzusuna keçid buraxın. Etiraz edə bilərsiniz, bunun nəyi pisdir? Digərləri bir keçid buraxdılar, biz də edə bilərik. Amma! Linkləri yalnız Khrumer deyil, digər proqramlar da tərk edə bilər. Üstəlik, onlar yüksək ixtisaslaşmış proqram adlanan müəyyən resursda şərh yazmaq üçün xüsusi olaraq hazırlana bilər, üstəlik bu cür keçidlər əl ilə buraxıla bilər. Yenə təkrar edirəm, bizim üçün vacib olan zibilin miqdarı deyil, düzgün sorğularla məlumat bazasını toplayacağımızdır; Bu metodun üstünlüyü ondan ibarətdir ki, praktiki olaraq konfiqurasiyaya ehtiyacınız olmayacaq ələk-süzgəc
, sadəcə onu söndürə bilərsiniz, çünki Google praktik olaraq sizə zibil verməyəcək.
Düşünürəm ki, ilkin mərhələdə Xrumerdən düzgün istifadə etməyi öyrənmək çox vacibdir, çünki bunu öyrəndikdən sonra vəziyyət necə dəyişsə də, həmişə Xrumer üçün istifadə tapa bilərsiniz. Mühafizələr getdikcə mürəkkəbləşir və əgər bəzi növ mühərriklərdə mühafizə gücləndirilibsə və Khrumer bu anda öhdəsindən gələ bilmirsə, o zaman bu əlaqələri toplamaq üçün vəsait xərcləməyin və sonra Khroomer ilə işləməyin mənası yoxdur. gücləri nəticə verənə cəmləmək daha yaxşıdır. Və eyni zamanda, əgər Botmaster Labs komandası Khroomer-ə yeni bir şey öyrədibsə, siz tez bir zamanda yeni xəstəni parçalaya və xəstə hələ də isti ikən Khroomer üçün baza hazırlaya bilərsiniz. Zaman puldur; bazanı satın aldığınız zaman resurs artıq aktual olmaya bilər. kimsə tərəfindən yığılmışdır. Bundan əlavə, özünüz üçün əsasların düzgün toplanması Khrumer-in "ağ" istifadəsini əhəmiyyətli dərəcədə genişləndirir. İstəsək də, istəməsək də hər şey məhz bu yerdə hərəkət edir və ağartma və ya bozlaşma prosesi davam edir. Qara vərəqlər hər cür şəkildə keçmişə çevrilir. Hrefer ilə işləməyin bütün digər texniki aspektləri yardımda nəzərdən keçirilə bilər və onların üzərində dayanmağın mənası yoxdur. Bonus olaraq, Çin axtarış motoru Baidu-nu təhlil etmək üçün burada bir şablon yerləşdirəcəyəm, ötən gün bu barədə məndən soruşdular, buna görə də bunu təsadüfən etdim, söz oyunu üçün üzr istəyirəm. :)
Onları təhlil etməyə cəhd etdim, heç bir qadağa yox idi, Khrefer resursları tez topladı, təhlil üçün bütün sorğular Google-a bənzəyirdi, lakin çoxlu Çin resursları var idi, yüksək PR ilə və üstəlik, çox yer var idi ki, Avropa nə vaxtsa ayaq basmışdı. Çin sorğularını təhlil etmək daha yaxşıdır. Google translate bu işdə kömək edəcək, rus dilində açar sözlərin siyahısını yazın və onu Çin dilinə tərcümə edəcək. həqiqət " Sözlər“Hrefer sözləri Çin dilində əlavə edilə bilməz, onları yenidən kodlaşdırmaq lazımdır. Çin əvəzinə:
伟哥 - Viagra
吉他 - gitara
其他 - istirahət
保险公司 - sığorta
Bu əvəzedici kodları Words faylına qoyun:
%E4%BC%9F%E5%93%A5
%E5%90%89%E4%BB%96
%E5%85%B6%E4%BB%96
%E4%BF%9D%E9%99%A9%E5%85%AC%E5%8F%B8
Əgər siz sığorta vebsaytını təbliğ edirsinizsə, o zaman profilinizdə tematik (!) hətta sorğu ilə tapılan Çin forumunda bir keçid yerləşdirərək " SMF forumu" 保险公司 cox yaxsi olacaq. Sonda demək istərdim ki, buna cavab olaraq Xreferlərin pis və ya pis bişirilməsindən şikayətlənən insanları heç vaxt başa düşməmişəm, mən həmişə demək istəyirdim ki, siz onları necə bişirəcəyinizi bilmirsiniz; Heç bir təhlilçi sorğulardan daha yaxşı nəticələr toplaya bilməz; Hrefer avtomobildir: yaxşı, möhkəm, alman dilindədir, lakin onu insan idarə edir və hər şey onun necə yaxşı idarə olunmasından asılıdır, siz maşını eyni anda həm sağa, həm də sola sürməyə məcbur edə bilməzsiniz; Ayrı bir mövzu verilənlər bazalarının təmizlənməsidir, mən bunu bir dəfə 3 il əvvəl əvvəlki müsabiqə üçün etmişdim. Əksəriyyət üçün orada hər şey hələ də aktualdır, amma indi 200 OK-u yoxlamaqdan imtina edə bilərsiniz, bu prosesi həqiqətən bəyənmədim, çox böyük səhvlər var idi, bir çox lazımsız şeylər süzüldü. İndi bu, Khrumer-in işləməsi zamanı demək olar ki, avtomatik olaraq edilə bilər, baxmayaraq ki, bu proses "200 OK" yoxlamasının tam analoqu deyil. Hər halda, nöqtəyə: bir müddət əvvəl Xrumerdə gözəl bir fürsət yarandı - layihənin icrası zamanı resurslardan məlumatı oğurlamaq. Bu belə görünür. Siz əməliyyat zamanı emal ediləcək şablonu daxil edirsiniz və şablondan toplanan məlumat Logs qovluğunda xgrabbed.txt faylına daxil ediləcək. Bu funksiyadan hər şey üçün istifadə edə bilərsiniz, təxəyyül uçuşu böyükdür. Mən bu funksiyadan həftədə bir dəfə işlək "müddəti bitmiş" verilənlər bazamdakı bağlantıları silmək üçün istifadə edirəm. Heç kimə sirr deyil ki, bu cür mənbələrdən məlumat bazamızı təmizləmək üçün forumlar hər gün ölür və "Avtograbbing" aləti bu işdə bizə kömək edəcəkdir. Axı, etiraf etməlisiniz ki, biz tez-tez, məsələn, http://www.laptopace.com/index.php yazanda görürük ki, bu domen artıq, məsələn, pul satan yaxşı oğlandır, amma yoxdur. orada forum. Deməli, bu şlakı bazadan atmaq üçün soyacağıq. :) Səhifənin mənbə kodunu açın və orada bu girişə baxın:
laptopace.com
Tutmaq üçün onu çevirə bilərik
[...]
İndi Quudaddidən olan bütün “ölülər” bizə adları ilə tanınacaq. Müxtəlif “müddəti bitmiş” domenlərin verilənlər bazasını təmizləmək istəyirsinizsə, Autograbbing aləti üçün kiçik bir seçimdir: