Partnerji. Mihail Volovič. Kako piše na internetu Mikhail Volovich. Kako piše na internetu?

Kako piše na internetu?

Mihail Volovič. Kako piše na internetu?


Posvečeno Ramblerju

Številne redakcije imajo »interne standarde« – pisne ali nenapisane dodatke k običajnim pravilom črkovanja in ločil. Urejajo pisanje novih besed, postavitev velikih začetnic in narekovajev ter druge težke primere ter svarijo pred pogostimi napakami.

Leta 2001 sem moral sam vzpostaviti in implementirati takšne interne standarde v internetnem holdingu Rambler. A potem so pravila, žal, ostala nenapisana. Ta kratek članek je poskus povzetka nabranih izkušenj (bolje pozno kot nikoli). Upam, da bo komu koristilo - tudi morda na Ramblerju.

In osebno posvetilo, prav tako povezano z Ramblerjem, spominu na Sergeja Brovcina, enega najbolj hvaležnih poslušalcev mojih priporočil.

Ali ni pomembno, kako

Priljubljenost in komercialni uspeh internetnega vira sta odvisna od »uredniških« kvalitet - pa tudi od kakovosti na splošno - vendar ne predvsem. Le malokdo je ob obisku spletnega mesta pozoren na majhne stvari, kot so črkovalne napake (še posebej, če niso preveč hude), nedoslednosti in slab dizajn.

In vendar mesto uglednega podjetja, na katerem sredi slov srečati dodatni pomišljaji (sledi ročnih pomišljajev) ne izgledajo več tako solidno. Tega se ne bom lotil dokazovanja, a osebno sem prepričan, da se uredniško delo in preprosto dober okus izplačata povsod, tudi na internetu.

Internet, Internet, Internet

Začnimo z najbolj perečo stvarjo: navsezadnje Internet oz Internet?

V Ruskem pravopisnem slovarju iz leta 1999 je bilo zabeleženo Internet; Tudi jezikovna vaja je bolj verjetno na njegovi strani, vendar je trend očitno v smeri »nižanja« črke. Na primer, časopis Vedomosti (za zdaj?) dosledno piše Internet- vendar je založba Kommersant javno objavila prehod na Internet; Še prej so to storili nekateri internetni viri.

Glavni argumenti v prid malim ("majhnim") črkam:

Ruski jezik se nagiba k spreminjanju lastnih imen v skupna imena in s Internet to se je že zgodilo (kot se je zgodilo prej z fotokopirni stroj in plenica); Internet- nič drugega kot komunikacijsko okolje (možnosti: "način oddajanja", "informacijska kultura"), enako kot telefon, TV oz pritisnite.

Glavni argumenti v prid velikimi črkami:

Internetše vedno ostaja ime edinstvenega predmeta, lastno ime - enako, na primer kot Mars, Interpol oz Talibani. Internet ni le »medij« in zagotovo ne »metoda oddajanja« (moje uho noče zaznati izrazov, kot je * prijavi na spletu). To je specifično računalniško omrežje; v zadnjih 10 letih je zelo zrasla, vendar je ohranila svojo individualnost, ima svoje zakonodajne organe, infrastrukturo itd.; ni si težko predstavljati drugega svetovnega računalniškega omrežja, vzporednega ali alternativnega internetu.

(Mimogrede, v angleščini Internet- skoraj vedno internet, z določnim členom in zdi se, da ni razprave o velikih začetnicah.)

Če argumenti navijačev Internet se vam zdijo prepričljivi ali pa se preprosto bojite, da bi zaostali v življenju - napišite Internet. Ampak še vedno verjamem v to Internet- lastno ime. Zato priporočam:

  • Internet, nezaželeno * Internet;
  • Mreža(ko gre za internet), Svetovni splet; Ampak Svetovni splet;
  • Runet, narobe * Runet(vsekakor se ne more šteti za »metodo prevajanja«).

Vendar pa v zloženkah kot internetni ponudnik, spletna knjižnica beseda Internet deluje kot definicija. Pisanje v takih primerih z veliko začetnico je precej resna napaka. Druga zelo pogosta napaka je pisanje takih tvorb z dvema besedama, brez vezaja.

  • internetna kavarna, Internetni vir, Internetna javnost in tako naprej.; narobe * Internetni vir, *Internetni vir.

Beseda Internet- tako dobro, kot Interpol z Talibani- naj se prikloni, če stoji sam. Napisano z latinskimi črkami, Internet, Interpol, Talibani, seveda se ne klanjajo; toda vse te besede je ruski jezik že dolgo sprejel in ni razloga, da bi jih pisali v latinici.

  • v internetu, uporabniki interneta, uporabniki interneta; narobe * v internetu, *uporabniki interneta; nezaželeno * na internetu.

Brskalnik, oznaka, brez povezave

Veliko je besed, ki jih na internetu srečate na vsakem koraku v najrazličnejših zapisih, a jih do nedavnega ni bilo v slovarjih.

Mnogi od njih so podobni meni Internet- vključeno v ruski pravopisni slovar leta 1999, ki ga je uredil V.V. Lopatin. Številne druge so bile vključene v več kot tisoč in pol besed, ki so bile od leta 1999 dodane elektronski različici tega slovarja.

  • brskalnik, Spletni brskalnik(napačno * brskalnik, *splet);
  • oznaka, HTML oznaka(napačno * oznaka), znamka, blagovno znamko(napačno * znamka); predpomnilnik, predpomnilnik(napačno * predpomnilnik); zgoščena tabela;
  • na spletu, na spletu in v spletnem načinu,na spletu; brez povezave, brez povezave; na morju, na morju(nezaželeno * na spletu, *brez povezave, *brez povezave, *na morju);
  • prometa(napačno * prometa);
  • igralec, internetni predvajalnik(nezaželeno * igralec, čeprav je ta možnost zapisana v nekaterih slovarjih);
  • PR(napačno * PR), PR agencija(oz PR agencija), PR, piarovec;
  • nepremičninar(napačno * nepremičninar, *nepremičninar; pred desetimi leti sem ga poskušal popraviti strokovnjak za nepremičnine, vendar je zmagal); distributer(hkrati sem se boril za distributer, vendar tudi neuspešno);
  • gostovanje; noč čarovnic; vikend; zvočni posnetek;
  • cenik(čeprav je bolje uporabiti besedo, ki je tudi izposojena, vendar prej zakoreninjena v ruskem jeziku cenik; narobe * cenik); glavni čas.

Slovar na nek način "prehiteva" uveljavljeno knjižno normo, pri čemer se vnaprej osredotoča na spremembe, ki jih pravopisna komisija pod vodstvom V. V. Lopatina namerava narediti v ruskem pravopisu. Poleg tega se lahko kaj spremeni od trenutne elektronske različice do nove izdaje slovarja. Strogo gledano, ni treba upoštevati njegovih priporočil; na primer v Kommersantu dosledno pišejo distributer in nepremičninar, A igralec pojavlja nič manj pogosto kot igralec.

Če pa obstajajo "razhajanja", se mi zdi smiselno poslušati priporočila najbolj avtoritativnega pravopisnega priročnika do danes.

CD-ROM, e-pošta, Java

  • E-naslov, E-naslov", e-pošta "om; Ruski ekvivalent, boljši od E-naslov oz email naslov, še ne (če pa res želite nekaj pogovornega, potem je bolje glede na "milo" oz po elektronski pošti, kako * po elektronski pošti ali * po elektronski pošti);
  • CD ROM, CD ROM; CD, in če "v ruščini", potem CD;
  • Beseda, v Wordu(pisanje * v Wordu pogovorno in zato nesprejemljivo v spodobnih besedilih); Excel, o Excelu, ...;
  • programček Java(ime jezika Java v ruščini ni ustaljeno, zato ga je bolje napisati v latinici).

Glavna stvar je biti dosleden

Na koncu, kar je pomembno, ni kako pišemo in kako dosledno. Beseda Internet Lahko pišete z veliko začetnico, lahko pa tudi z malo (glej zgoraj). Vendar to ne pomeni, da je mogoče narediti oboje. Odločiti se moramo in ji slediti.

Ko na eni ekranski strani (na natisnjeni, hvala bogu, ni bilo treba) vidim dve novici - eno o bin Laden in al-Kaida, drugi pa približno Bin Laden in Al Kaid(in eden omenja palestinsko mesto Ramallah, in v drugem Ramallah), - plezam po steni.

Slabo je, če so na koncu naslovov pike (glej spodaj) – še huje pa je, če so včasih pike, včasih ne.

V svoje povezave lahko vključite naslednja ločila ali pa jih ne vključite - vendar je bolje, da tega ali onega ne storite.

Dekoracija besedila

  • ne! - velike nestrukturirane količine besedila.

Največja dolžina odstavka, ki sem ga jaz (uporabnik) pripravljen prebrati z zaslona, ​​je 6-8, no, 10 vrstic. Potem bom še vedno skočil: v najboljšem primeru na naslednji odstavek, v najslabšem na naslednje spletno mesto.

Prav tako je zelo priporočljivo, da besedilo razdelite na majhne fragmente (poglavja) z ločenimi naslovi.

  • ne! - prelomi vrstic (
    ). ja! - polni odstavki (

    oz

    ).

Standardni HTML ustvarjalcu spletnega mesta pušča zelo malo izbire: ali si odstavki sledijo v vrsti in se držijo skupaj, ali pa se cela vrstica preskoči in besedilo postane napihnjeno. Od dveh zla je prvo veliko hujše. Meje odstavkov, ki si sledijo brez presledkov, so zelo slabo vidne, besedilo je videti kot nerazdeljeno. In če je zadnja vrstica odstavka dovolj dolga, se obroba lahko popolnoma izgubi.

  • ja! — oštevilčeni in neoštevilčeni seznami (označeni seznami)

Prepričati se morate le, da lahko jasno vidite, kje se vsak element začne in konča. V tem primeru je seznam enostavno preleteti, kar je zelo pomembno pri branju z zaslona.

  • ja! — poudarjanje pomembnih mest v krepkem ali poševnem tisku (vendar ne v prevelikih količinah). ne! - podčrta zunanje povezave.

Priročno je, ko ima oko nekaj za prijeti; to vam pomaga hitro skenirati besedilo in razumeti, kaj morate v njem prebrati in česa ne bi smeli - zelo dragocena kakovost za internet. Vendar je podčrtavanje napačno: rezervirano je za povezave in vsaka drugačna uporaba bo zmedla obiskovalce spletnega mesta.

Velike začetnice in pike v naslovih.

Ta naslov namerno vsebuje napako, ki je zelo pogosta na internetu in zelo žaljiva v državi s tako bogato kulturno tradicijo. V njem (verjetno ste opazili) se vse besede začnejo z velikimi začetnicami.

Tako je običajno oblikovati naslove ne v ruščini, ampak v angleščini. (In v angleščini je običajno pisati dneve v tednu in mesecih, imena ljudstev in pridevnike iz njih z velikimi tiskanimi črkami. In vejice v angleščini so postavljene popolnoma drugače kot v ruščini. In besede so drugačne. In celo črke... In v nemščini se na splošno vsi samostalniki pišejo z veliko začetnico.)

Ruska tradicija oblikovanja tiskanih besedil zahteva samo eno veliko začetnico v naslovih - na začetku (plus lastna imena itd.). Naslovi se od običajnih stavkov razlikujejo le v enem: ni običajno, da bi na koncu naslovov (kot tudi napisov pod fotografijami) pika.

Yo

Internet je dedič tiskanega, ne pisnega besedila. Ne glede na to, ali je dobro ali slabo, natisnite pike v tiskanem besedilu. e ne sprejemajo (razen slovarjev, izobraževalne literature itd.). Knjiga o kemiji, ki vsebuje e, bi bilo videti nedostojno - in prav tako nedostojna so mesta, kjer e ne splača e. (Zato morate pred objavo dokumenta v knjigi ali na internetu pogosto opraviti na videz nepotrebno in absurdno delo: poiskati označeno e in jih zamenjajte z e.)

Seveda, knjige in spletne strani, kjer e Včasih je označeno, včasih ne, videti so še bolj nedostojno.

Vendar, če točke zgoraj e pomoč pri razjasnitvi pomena, razreši homonimijo ( naredil vse - naredil vse), jih je še vedno priporočljivo namestiti. Ponavadi odidem e v besedi Vse, tudi če ga zamenjujejo z Vse dovolj težko.

Narekovaji in pomišljaji

Ko delam v Wordu, vedno postavim pomišljaj in skoraj vedno - narekovaje v obliki ribje kosti, v angleškem besedilu pa narekovaje s nogami (imam onemogočeno funkcijo samodejnega popravka, zato sem to namerno naredil "ročno"). dokumente, ki jih ustvarjam, oblikujem v skladu s »knjižnimi« standardi, sestavni del katerih so pravilni pomišljaji in narekovaji.

Vendar se moram prepričati, da so v mojih dokumentih in dokumentih drugih narekovaji zamenjani z enostavnimi (", ") in pomišljajem z navadnim vezajem (-), preden so objavljeni v spletu. To je varnost pomisleki (združljivost z drugimi kodiranji in operacijskimi sistemi) so pomembnejši od lepote.

Bistvo je, da pomišljaj - , Citati božičnega drevesa « » in tace (dvojne “ ” in samski ‘ ’ ) in nekateri drugi znaki (na primer številka E, odstavek § , elipsa , ppm , srednja točka, plus ali minus ± ), ki so v kodiranju »Windows« (Windows-1251), v koi8-r in drugih ruskih kodiranjih, v katerih jih uporabnik lahko prejme, manjkajo ali so na napačnih mestih. Pri izpisu besedila v kodiranju, ki ni Windows-1251, so lahko ti znaki popačeni (čeburaške začnejo teči v besedilu). Možno je, da v tem odstavku ne vidite znakov, ki sem jih omenil zgoraj, ampak nekaj nerazumljivih ikon; če ne, ste nedvomno že videli takšne ikone na drugih spletnih mestih.

Posebni znaki, kot sta - (pomišljaj) in ‰ (ppm), ne rešijo situacije, saj v koi8 preprosto ni ustreznih znakov. Najlepši izhod iz situacije je objaviti besedila v sistemu Windows-1251 in konfigurirati programe tako, da se pri preklopu na koi pomišljaj samodejno zamenja z vezajem, znak številke zamenja črka N itd. To pa zahteva posebno programiranje in ni vedno mogoče. Zato moramo neradi podati naslednje priporočilo.

  • Pred objavo besedila na internetu, če vaš strežnik nima posebnih ukrepov za pravilen prikaz »posebnih znakov«, morate zamenjati vse vrste narekovajev z enostavnimi narekovaji, pomišljaj z vezajem in znak številke s črko. n ali beseda "številka" in tako naprej.

In še enkrat o Ramblerju

  • "Rambler", na Ramblerju; nezaželeno * Rambler.

Rambler si je v začetku leta 2000 izbral rusko ime, ki je zapisano v njegovem uradnem imenu (JSC Rambler Internet Holding). Rambler tisti, ki se ga spominjajo iz zelo starih časov, še naprej kličejo Rambler Stekovskega.

  • z internetnim holdingom "Rambler", zelo nezaželeno * z Rambler Internet Holding!

Zgodilo se je, da je bilo zakonsko zapisano ne povsem pravilno ime (komu se to ne zgodi - poglejte Ashmanov in partnerji zapisano tudi na angleški način z dvema velikima črkama). To uradno ime Rambler se lahko in mora uporabiti kot citat, na primer: pri OJSC (podjetje) Rambler Internet Holding. ampak * pri Rambler Internet Holding sliši se pošastno!

  • Rambler's Top100 Tako je treba zapisati. narobe * Rambler Top100, *Rambler Top100, *100 najboljših, *Top100 in tako naprej.

Opombe

Citiram Artemija Lebedeva s strani redactor.ru: »Omeniti velja, da večina ljudi piše Internet z veliko začetnico te besede pogosto ne zavrnejo in ji dodajo konstrukcijo »mednarodno globalno računalniško omrežje«, kar je primer očitnega staromodnega razmišljanja.« (

Poslovodni partner družbe

Eden najbolj znanih menedžerjev v Runetu, specialist na področju umetne inteligence, razvoja programske opreme in vodenja projektov. Poslovodni partner družbe "Ashmanov in partnerji". Diplomiral na Fakulteti za mehaniko in matematiko Moskovske državne univerze, kandidat tehničnih znanosti.

Igor Ashmanov se z informacijsko tehnologijo ukvarja od leta 1983. Vodil je razvoj programa za preverjanje črkovanja Orfo v informatiki, bil solastnik in generalni direktor podjetja MediaLingua, ki je izdelovalo slovarje MultiLex, in bil izvršni direktor internetnega holdinga Rambler. V tem času je izdal več deset projektov, med drugim:

  • Jezikovni modul ORFO (program za preverjanje črkovanja in sloga, tezaver, modul za deljenje besed) v ruski različici Microsoft Officea, ki ga uporabljajo milijoni ljudi po vsej Rusiji;
  • Elektronski slovarji "MultiLex", ki še vedno ostajajo najboljše profesionalno prevajalsko orodje v Rusiji;
  • Različica iskalnika Rambler, izdana leta 2001, in večina spletnih mest in storitev portala Rambler pred njihovo posodobitvijo leta 2012.
  • Filter neželene pošte »Spamtest«, ki ščiti desetine milijonov uporabnikov (zdaj se prodaja pod blagovno znamko »Kaspersky Antispam«).
  • Iskalnik po novicah Novoteka, ki združuje in združuje novice iz več sto virov.
  • Ljudsko iskanje "Flexum" je storitev za ustvarjanje tematskih iskalnikov.

Igor Ashmanov je član Mednarodne zveze internetnih aktivistov "EZHE", dvakrat je zmagal v nominaciji "Osebnost leta" na tekmovanju omrežja ROTOR (v ROTOR 2004 in v ROTOR-2006), v okviru "EZHE" gibanja obstaja Galerija vidnih mrežnih osebnosti, v kateri ima FRI Igor Ashmanov.

Družba partner

Znan specialist na področju upravljanja proizvodnje programske opreme. Trenutno se ukvarja z razvojem in razvojem tehnologije Semantic Mirror in številnih drugih. Diplomiral na Fakulteti za fiziko Moskovske državne univerze. Predava programiranje na oddelku za fiziko.

V letih 1999–2001 je Aleksej delal kot vodja iskalnega projekta pri Ramblerju, kjer je bila pod njegovim vodstvom razvita in zagnana nova različica iskalnika.

V letih 1995–1999 je bil Aleksej Ivanov tehnični direktor podjetja MediaLingua, kjer je vodil razvoj družine računalniških slovarjev MultiLex in številne druge projekte.

V letih 2001–2005 je sodeloval pri razvoju filtra za neželeno pošto Spamtest v podjetju Ashmanov in partnerji.

V letih 2004–2007 - vodja projekta Semantic Mirror in projekta iskalnika Ashmanov in partnerji.

V letih 2006–2012 - vodja razvoja projekta Search Engine Analyzers.

V letih 2010–2011 - vodja projekta "družbeno iskanje" Flexum.ru.

Od leta 2011 do 2016 je bil projektni vodja Wada.vn, iskalnika za vietnamski segment interneta.

V letih 2015–2016 - vodja razvoja WadaMarket.com, zbiralnika izdelkov za vietnamske spletne in nespletne trgovine).

Družba partner

Specialist v Rusiji za internetne tehnologije, razvoj kompleksnih spletnih mest, visoke obremenitve, velike količine podatkov. Pri družbi Ashmanov in partnerji razvija iskalnik.

Najbolj znana sta bila lastna projekta Russian Internet Survey in ruski spletni strežnik Apache, ki poganja več kot polovico vseh spletnih mest Runet.

Eden najboljših strokovnjakov v Rusiji za internetne tehnologije, razvoj kompleksnih spletnih mest in internetnih storitev, visoke obremenitve, velike količine podatkov. Diplomiral na geološki fakulteti Moskovske državne univerze.

Alexey je najbolj znan po lastnih projektih Russian Internet Survey in ruskem spletnem strežniku Apache.

V letih 1999–2001 je bil Aleksej vodja projekta Rambler's Top100 v internetnem holdingu Rambler.

Od leta 2001 - zaposleni in solastnik podjetja "Ashmanov in partnerji".

V letih 2004–2006 je bil tehnični direktor podjetja Search Technologies, avtor iskalnika novic Novotek in mreže za izmenjavo novic.

Od leta 2008 je tehnični direktor podjetja LibRaw LLC, ki razvija programsko opremo in razvojna orodja za digitalno fotografijo.

Trenutno v podjetju ni projektov.

Alexey Tutubalin je član Mednarodne zveze internetnih aktivistov "EZHE", trikrat je zmagal v kategoriji "Raziskovalec leta": na omrežnem tekmovanju ROTOR 2006, na tekmovanju ROTOR++ 2007 in na tekmovanju ROTOR 2008 v okviru v okviru gibanja "EZHE" obstaja Galerija vidnih omrežnih osebnosti, ki vsebuje .

Družba partner

Specialist za izdelavo IT aplikacij, ki združuje znanja in veščine menedžerja, programerja in jezikoslovca. V podjetju Ashmanov and Partners je odgovoren za tehnologije umetne inteligence.

Diplomiral na Filološki fakulteti Moskovske državne univerze, oddelek za uporabno jezikoslovje.

V letih 1996–1999 je Kirill Zorkiy delal kot vodja oddelka za jezikoslovje pri MediaLingvi, kjer je izdeloval slovarje MultiLex. Vodil pripravo podatkov za elektronske slovarje, razvijal računalniške oblikoslovje več jezikov.

V letih 1999–2001 je Kirill delal kot vodja oddelka za vsebinske projekte pri Ramblerju, v tem času pa je izdal več deset projektov vsebine Rambler.

Od leta 2001 je Kirill Zorkiy zaposlen in solastnik družbe Ashmanov and Partners.

V letih 2001–2005 je bil vodja projekta Spamtest.

V letih 2005–2007 - vodja oddelka za zaščito pred neželeno pošto v podjetju Kaspersky Lab, vodja projekta Kaspersky Antispam.

Trenutno je tehnični direktor podjetja Nanosemantics.

Družba partner

Kandidat fizikalnih in matematičnih znanosti, eden najboljših strokovnjakov v Rusiji na področju razvoja tehnično zapletene programske opreme, tehnične revizije in vodenja IT projektov.

Diplomiral na Fakulteti za fiziko Moskovske državne univerze, kandidat fizikalnih in matematičnih znanosti.

V letih 1996–1999 je bil Dmitry zaposlen v podjetju MediaLingua in je sodeloval pri razvoju večine projektov MediaLingua: elektronskih slovarjev, iskalnih storitev, strežniških aplikacij, internetnih projektov itd.

V letih 2000–2001 je Dmitry Pashko delal v internetnem holdingu Rambler, najprej kot vodja operativnega oddelka in nato kot tehnični direktor. V tem času je bilo pod njegovim vodstvom razvitih, testiranih in objavljenih več kot 30 projektov. Zlasti leta 2000 je Dmitry vodil edinstven projekt internetnih iger »Kaj? Kje? Kdaj?«, v kateri so se ekipe strokovnjakov pomerile z »univerzalnim umom«.

Od leta 2001 je zaposlen in solastnik Ashmanov in partnerjev, sodeloval pri projektih Spamtest, SeoRate, Semantic Mirror, pa tudi pri razvoju spletnih storitev podjetja.

Od leta 2013 vodi tehnološki razvoj družbe Ashmanov in partnerji. Sodeluje pri hčerinskih projektih podjetja, povezanih z analizo interneta in zaščito uporabnikov pred nezaželenimi informacijami.

Družba partner

Jezikoslovec, leksikograf, specialist za intelektualne tehnologije in uporabnost spletnih strani. V družbi Ashmanov in partnerji je zaposlen od njene ustanovitve. Trenutno vodi Laboratorij za analitiko iskanja.

Delal je kot urednik produkcije Kommersanta (tedaj tednika). Razvil je najboljši algoritem za deljenje besed za ruski jezik doslej. Napisal angleško-ruski slovar »Krščanstvo«. Pripravljeni podatki za slovarje MultiLex. Bil je odgovorni urednik portala Rambler. Sodeloval je (in še sodeluje) pri ustvarjanju odlične poljudnoznanstvene spletne strani Elementy.ru.

Od leta 2007 dela na projektu AnalyzeThis.ru - to je več kot 70 avtomatskih analizatorjev, ki ocenjujejo kakovost iskanja v ruskem, angleškem, kitajskem in vietnamskem jeziku. Preučeval je pojav iskalne neželene pošte in razvil metode za boj proti njej. Vodil pripravo podatkov in delo jezikoslovcev za vietnamski iskalnik Wada.vn in trg Wada.

V letih 2014–2015 je bila zaposlena kot direktorica trženja in zunanjega komuniciranja v podjetju Kribrum, kjer je bila odgovorna za razvoj storitev.

Od leta 2015 vodi komunikacijsko agencijo Ça Va Agency.

Od leta 2017 je generalni direktor družbe Ashmanov and Partners St. Petersburg.

Na prvi pogled so za komercialne zahteve popolnoma nepomembni. Korelacije s položajem v Yandexu obstajajo le za majhen del besedilnih parametrov, pa še takrat so šibke. V prvih treh in v tretjih desetih iskalnih rezultatih je število pojavitev poizvedbe v besedilu strani približno enako - enako lahko rečemo za naslov, za naslove h1-h4 itd.

A v resnici so kljub vsemu temu besedilni dejavniki kritično pomembni. Če primerjamo TOP 30 Yandexa za komercialne poizvedbe in enako ustrezne strani, ki niso bile vključene vanj (iz TOP 30 Google in Mail.ru), se izkaže, da so vrednosti skoraj vseh besedilnih parametrov v TOP Yandexa so statistično pomembno - in zelo opazno - višje.

To najverjetneje pomeni, da besedilni faktorji delujejo v predhodnih fazah rangiranja – ko se izbere približno tisoč rezultatov, ki se nato še podrobneje rangirajo.

To pomeni, da če na vaši strani ni dovolj pojavov poizvedbe (ali posameznih besed iz poizvedbe), se vaše možnosti, da pridete v Yandex TOP, močno zmanjšajo.

Torej, za poizvedbo "lestenci" v TOP 30 Yandexa sta samo dva rezultata, kjer se beseda "lestenec" pojavi manj kot 40-krat - lustron.ru s 23 pojavitvami in lestenec.rf s štirimi (in še eno v imenu domene). Medtem ko je v TOP 30 Googlu 5 strani, kjer se "lestenec" pojavi manj kot 10-krat. Povprečno število pojavov "lestenec" v besedilu strani za Yandex TOP 30 je 64 v primerjavi z 48 za Google in 30 za strani z vrhov Google in Mail.ru, ki niso bile vključene v Yandex TOP.

Kako se situacija z besedilnimi dejavniki v Googlu razlikuje od Yandexa?

Nasprotno, na Googlu so opazne korelacije med faktorji besedila in položajem – bližje kot je TOP 1, višje so vrednosti. Toda "vhodni filter" ni viden, kot v Yandexu, povprečne vrednosti besedilnih parametrov pa so običajno nekoliko nižje.

Je pa veliko skupnega. Torej, pri obeh iskalnikih so dejavniki razvrščanja močnejši, čim dlje se odmikamo od »črke« poizvedbe. Zdi se, da natančne oblike zahteve iskalniki ne ločijo več od vseh drugih. Število posameznih poizvedbenih besed, razpršenih po besedilu, je pomembnejše od tega, kolikokrat se pojavijo skupaj. Pomembni so tudi sinonimi poizvedbenih besed in v še večji meri “dodatki” – tiste besede, ki jih iskalniki sami izpostavijo v delčkih.

Več o tem v našem obsežnem analitičnem poročilu o faktorjih rangiranja, ki smo ga pripravili za konferenco Optimizacija 2017.

Vrnimo se neposredno na Yandex. Blog iskalnika pravi, da je "Baden-Baden" osredotočen na preveč optimizirana besedila. Analizirate spletna mesta pod "Baden". Na katere posebne funkcije se glede na vaša opažanja osredotoča algoritem Yandex? Zakaj spletna mesta spadajo pod »Baden-Baden«?

Načeloma je v blogu Yandex vse jasno oblikovano: »Vsebujejo veliko ponavljajočih se ključnih besed in nenaravnih govornih vzorcev, a malo uporabnih informacij. Takim besedilom pravimo preoptimizirana ...«

Preprosto je videti, da Yandex ponovno optimizacijo razume na širok način - vključno ne le z "neželeno pošto po ključnih besedah", temveč tudi z nizko naravnostjo in neuporabnostjo za uporabnika.

Z drugimi besedami, Yandex ne mara SEO besedil. Poleg tega jih že dolgo ni maral (glej mantre o straneh, »narejenih za ljudi«), zdaj pa se jih je naučil prepoznati in se jih je odločil zanje kaznovati.

Kako natančno jih prepozna, je ločeno in veliko manj pomembno vprašanje. Dejavnikov je lahko veliko, nanašajo pa se na vse tri komponente SEO besedila – obilico ključnih besed, nenaravnost in nizko uporabnost. Različni frekvenčni parametri (tako povezani z zahtevami kot nepovezani); besedišče, tipično za SEO besedila; dolžina in položaj besedilnega bloka; prisotnost skritega besedila; struktura besedila. In to ni popoln seznam.

Najverjetneje je bil problem rešen na povsem praktičen način. Faktorji, ki jih Yandex že uporablja za druga opravila (na primer pri razvrščanju), so bili maksimalno uporabljeni; dodali so jim številne nove dejavnike, razvite posebej za to nalogo. Strojno učenje je bilo izvedeno tolikokrat, kot je bilo potrebno, da se doseže zahtevana popolnost in natančnost. Nato smo izvedli A/B testiranje – in v boj.

Nismo poskušali ugotoviti, kaj točno Yandex upošteva - za to očitno ni dovolj podatkov in na koncu ni tako pomembno. Poskušali smo se naučiti prepoznati in oceniti SEO besedila. In mislim, da nam je dobro uspelo. Poleg tega je pomembno, da ne podamo zgolj sumarne ocene, ampak vse podrobno predstavimo in s tem pokažemo, kaj bi bilo koristno popraviti.

Kolikšen odstotek nizkokakovostne vsebine je sprejemljiv na strani? Koliko bi morali biti pozorni na filter strani? In koliko časa traja, da se celotno spletno mesto filtrira?

Odstotki ne igrajo posebne vloge. Da bi se začel boriti proti besedilom SEO, se je moral Yandex najprej naučiti dobro razumeti strukturo spletne strani - označiti navigacijska področja, "predstavo", ocene, oglase, različne druge bloke - in besedilo SEO. Velikost »soda za med« (vsebinski del strani) ni pomembna. Velikost "muhe v mazilu" je pomembna. Večja kot je, slabša je. Lahko pa je tudi relativno majhna. Recimo dva tisoč znakov je vsekakor dovolj. Morda bo očitno dovolj nekaj odstavkov srednje velikosti - manj kot tisoč znakov, sto ali več besed. Težko je reči bolj natančno. Dejstvo je, da so za B.-B. pomembne tri vrste strani:

1) tiste, ki so padle pod filter strani;

2) tiste, ki so padle pod filter spletnega mesta;

3) tiste, ki jih navede tehnična podpora Yandex.

In nobena od njih ne zagotavlja popolne jasnosti.

Na žalost vemo zelo malo o filtru strani: med strankami Ashmanov in partnerjev ni bilo takih ljudi; Uporabniki Turgenjeva pogosteje poročajo o filtru spletnega mesta, malo je publikacij "v odprtih virih" itd. Primeri, ki so nam znani, spadajo v dve kategoriji - nesramni (velika "frotirna" SEO besedila, veliko "tara") in dvomljivi (promet je upadel tik pred objavo novega algoritma, zato lastnik spletnega mesta meni, da je to "Baden -Baden”, vendar zelo dvomimo).

Veliko več je znanega o filtru strani. Skoraj nemogoče pa je natančno ugotoviti, katere strani so bile upoštevane pri izrekanju sankcij, zato tudi niso primerne za določanje pragov. Prizadeta spletna mesta imajo strani z velikimi besedili SEO, ki si očitno zaslužijo »Baden-Baden« - in te pogosto vključujejo glavno stran spletnega mesta in strani glavnih razdelkov. In obstajajo tudi strani z zelo kratkimi bloki besedila in sploh brez njih. Za kaj je bilo spletno mesto kaznovano, je iz teh podatkov enostavno razbrati, kje pa Yandex potegne črto, je težko.

Nazadnje, tretja vrsta strani so tiste, na katere sam Yandex pokaže, ko odgovarja na zahteve spletnih skrbnikov. Zdi se, da so te strani specifične in številne od njih so znane, vendar je težava v tem, da pogosto ne razkrivajo preveč. Grobo rečeno, če bi bile vse takšne (in še hujše) strani pod sankcijami, Yandex preprosto ne bi imel kaj najti. Lahko si predstavljamo, da takšne strani povzročajo robote nekaj terjatve, vendar je bilo v vseh nam znanih primerih na istih straneh veliko slabše strani (vključno pogosto z glavo spletnega mesta). Ta spletna mesta si resnično zaslužijo "B.-B." - vendar strani, za katere Yandex meni, da jih je treba prikazati, niso igrale prve vloge pri tem.

Če govorimo o trgu, koliko spletnih mojstrov se je po uvedbi Baden-Badna po vaših opažanjih »spametovalo«?

Presenetljivo veliko, kljub dosedanji zelo ciljni uporabi sankcij.

Zdaj sta jasno vidni dve glavni konkurenčni strategiji - varno igrati ali počakati, da pečeni petelin kljune. Drugega res ne priporočamo.

Da bi se izognili sankcijam, je dovolj, da odstranite ali uredite odkrito nenaravna besedila. Običajno so vidni s prostim očesom - vendar lahko preverite pri Turgenjevu. Da se znebite sankcij, ki so vam že bile izdane, morate opraviti nalogo - uganiti, zakaj Platonu ni bila všeč stran, ki jo je poslal, in koliko jih je še. Preventiva je cenejša kot kurativa.

Decembra ste napovedali analizator besedil Turgenev. Povejte nam, kako in na katerih podatkih ste usposobili analizator? Kakšen je bil vzorec?

Tam res ni strojnega učenja. Obstajajo algoritmi in slovarji. Razviti in razhroščeni so bili na gradivu več sto strani, ki so spadale pod »Baden-Baden«, s približno pet ducatov različnih spletnih mest, pa tudi na tisoče drugih besedil, katerih kakovost smo ocenili neodvisno.

Strogo gledano, našo nalogo smo videli v tem, da se naučimo učinkovito samodejno prepoznati preveč optimizirana besedila - in, prav tako pomembno, razložiti, kaj natančno je z njimi narobe. Strojno učenje tega ne bi dovolilo.

Mimogrede, tudi v primerih, ko je neposredna grožnja "B.-B." ne, Turgenev je koristen za spletne skrbnike in tekstopisce, saj pomaga opaziti in popraviti nenaravna ponavljanja, slogovne napake in druge podobne težave.

Kako Turgenjev ugotovi, da je treba to ali ono vsebino dodati/odstraniti? S katerimi materiali storitev primerja besedilo pri analizi? Na primer s podobnimi, ki so že v bazi; vzeto iz rezultatov iskanja v realnem času; na podlagi povprečij vseh vsebin itd.?

Parametre, ki so odgovorni za Baden-Baden tveganje, smo najprej razvili znotraj Search Analytics Laboratory, šele nato je prišla ideja o javno dostopni storitvi. Zato imamo dve različni različici »Turgenjeva«: tisto, ki je objavljena na turgenev.ashmanov.com, za vsakogar, in »notranjega Turgenjeva« za naše stranke. Interna različica algoritma deluje s spletnimi stranmi in upošteva kontekst zahtev, na katerih naj bi jih našli. Na primer, oceni velikost besedilnega bloka in vsebino vode na podlagi uspešnosti strani v Yandex TOP za določene poizvedbe.

Javna različica deluje samo z besedili (ta omejitev je omogočila, da je storitev brezplačna) in zato nima s čim primerjati materiala, ki se testira. Preprosto se oceni po več parametrih, pridobi kazenske točke, če jih ima, posledično pa se tveganje oceni na podlagi seštevka točk za različne parametre. Ne priporočamo dodajanja ali odstranjevanja vsebine – probleme le prepoznamo, kaj storiti glede tega pa se odloči avtor besedila ali lastnik spletnega mesta.

Na zavihku »Ponovitve« se izračunajo pogostosti besed in besednih zvez ter sestavi preprost model za oceno prisotnosti »super pogostih« besed. Običajno so v SEO besedilu to besede, za katere je (ponovno) optimizirano. Ocenjuje se tudi skupno število ponovitev v besedilu - za to uporabljamo parameter, ki ga ljubijo SEO s čudnim imenom "akademska slabost", ki smo ga morali izumiti na novo, saj je njegov recept, kot se je izkazalo, skrivnost. Pragovi zanj so postavljeni precej visoko - kazenske točke se začnejo od akademske slabosti 10,5, tj. "kaznovana" so samo besedila z res velikim številom ponovitev. In besedilo lahko dobi tudi točko za zelo visoko frekvenco veznika "in" - tu gre bolj za stilistiko, da bi ujeli besedila, v katerih "izkušeni in dobro usposobljeni zdravniki zagotavljajo kodiranje in se znebijo odvisnosti."

Na zavihku »Slogovniki« se pojavljanje več vrst besed in besednih zvez v besedilu enostavno prešteje. To so v prvi vrsti figurativne oblike, značilne za slaba SEO besedila. Na primer fragmenti Da bi se prepričali o tej izbiri, predlagamo, da pregledate ključne lastnosti izdelka oz vsi vedo, da je pralni stroj pomemben atribut kopalnice smo jih skoraj brez sledu razvrstili v narekovaje in zdaj bo vsako besedilo, v katerem se najde »bodite prepričani v to izbiro«, za to prejelo določeno količino »slogovnih kvantov«, ki se po določenem pragu spremenijo v kazenske točke. Poleg tega so opažene različne slogovne napake, klerikalizem, pretirano pogovorni izrazi in še veliko več. Vzeti so tudi iz SEO besedil, in čeprav mnoga izmed njih sama po sebi ne naredijo besedila nenaravnega, če jih je veliko, to postane težava, katere resnost se izraža v kazenskih točkah.

Na zavihku »Zahteve« so zapisane zahteve, najdene v besedilu s srednje velikega »komercialnega« seznama (približno dva milijona in pol). Če je pokritost zahteve visoka, lahko to pomeni pretirano optimizacijo.

Preostala dva zavihka dajeta točke manj pogosto in zelo malo naenkrat. “Vsebnost vode” - za nizek delež smiselnega besedila. "Berljivost" - za besedilo, ki vsebuje veliko dolgih stavkov in dolgih besed.

Koliko se lahko podatki za isto besedilo razlikujejo iz dneva v dan?

Običajno kar nekaj. Še naprej izboljšujemo algoritme in širimo slovarje, vendar je verjetnost, da se bo kaj opazno spremenilo za vaše besedilo, zelo majhna. Redka izjema je, če bi vaše besedilo danes uporabili za dopolnitev slovarjev.

Kako natančno Turgenjev določi tveganje, da mesto spada pod Baden-Baden?

Vsakič, ko izvemo za nov primer spletnega mesta ali strani, ki spadajo pod filter, preverimo delo Turgenjeva na njih. V 95% primerov se spopade - kaže kritično ali visoko tveganje. V tem smislu je vse v redu - le priporočamo, da preverite več besedil s spletnega mesta (in vsekakor SEO besedila, ne celotnih strani).

A to seveda ne pomeni, da bo vsako besedilo, za katerega je Turgenjev pokazal veliko tveganje, jutri padlo pod filter. Visoki rezultati preprosto pomenijo, da je besedilo neumno, preveč optimizirano in ga je treba urediti. Še vedno jih je veliko v Yandex TOP - tudi na prvih mestih, zlasti za zahteve po informacijah. Zakaj ni vprašanje za nas.

Predstavniki Yandexa, ko so obkroženi s strokovnjaki za SEO in tekmujejo drug z drugim, zakaj je moje spletno mesto pod filtrom, in tako in tako, še huje, brezplačno, običajno odgovorijo: "Ni še večer, vse ima svoj čas."

Temu odgovoru se lahko samo pridružimo.

Res je, lažni pozitivni rezultati so možni, če se preverjajo besedila, za katera Turgenjev ni zasnovan. Številni zakoni in drugi pravni dokumenti na primer prejmejo veliko točk za ponavljanje in nekaj več za slog in berljivost. Ja, tudi zakoni niso najbolj naravna besedila, napisana daleč od najboljšega sloga, čeprav ne pretirano optimizirana.

"Turgenjev" je zasnovan samo za komercialna mesta? Ali pa je primeren tudi za informacijske portale? Navsezadnje se zdi, da je SEO besedilo tam in SEO besedilo.

SEO besedila so drugačna in narava težav, predvsem slogovnih, pri preveč optimiziranem informativnem besedilu je nekoliko drugačna kot pri komercialnem besedilu. Iz besedil, kot je Preden odgovorite na vprašanje: "Doksiciklin - za kaj so te tablete?", Povejte, kakšno sestavo ima to zdravilo. morate zbrati oznake, ki so značilne zanje.

To počnemo po malem in tudi takšna besedila se ujamejo, čeprav nekoliko slabše kot komercialna. Tako je na primer stran, iz katere je vzet citat iz prejšnjega odstavka, prejela le 5 točk, čeprav si seveda zasluži več. Toda po drugi strani se to besedilo pojavi v Yandex TOP na prvem mestu (za poizvedbo "doksiciklin tablete" v času pisanja). Ko bo Yandex začel uporabljati »Baden-Baden« za »odlagališča besedila«, jim bomo namenili pozornost, ki si jo zaslužijo, in dobro bodo ujeti.

Še vedno ne poznamo niti enega potrjenega primera uporabe "B.-B." do informacijskih mest. Zelo bi bili hvaležni, če bi nam jih kdo od bralcev poslal - tako kot vse primere "Baden-Baden". Zanimanje je obojestransko – z veseljem se bomo z vami pogovorili o vašem primeru, kar nam bo pomagalo izboljšati storitev za vse.

Kako nameravate Turgenjeva razvijati, v katero smer?

O globalnih načrtih še nismo resno razmišljali, lokalno pa delamo na več zavihkih hkrati. Na primer, radikalno bomo izboljšali zavihek »Zahtevke« - in hkrati pospešili izdajanje odgovorov (dejavniki, povezani z zahtevami, se trenutno obravnavajo dlje kot vsi drugi).