|
Ха! Ява скрип и поисковики. Состояние - близко не стояние?
Платный хостинг
Создание и раскрутка сайтов
Увеличение члена
- Пару лет назад было вроде бы всё ясно. Если используешь ява скрипты и что на них сделано, то это поисковиками не индексируется и в дальнейшем при расчётах релевантности не используется. Например, "не индексировались":
- текст и ссылки в менюшках сделаные на яве;
- куски контента, которые «показывать поисковикам не надо»;
- картинки подгружаемые через ява скрипы;
- редиректы явавские;
- прочие и прочие, всё, что подгружалось файлами с *.js и требовало исполнения в клиентском браузере.
Официально эту аксиому поисковики не подтверждали и не опровергали. Подтверждало это дело практика, эксперименты и опыт. Постепенно картина менялась.
Как то месяцев 6-8 назад проскочило сообщение на форуме у Грэя, что Апорт перешёл по ява ссылке и значит он её учитывает и в дальнейшем, в своих расчётах как то использует. А если не использует, то нафига по ней переходить? Сейчас вот новая инфа проскочила о том, что Гугл доры под тыщу страниц «не хаваются», а точнее, наверное будет сказать, «хаваются», но с какой то «меткой» типа: «бла буду – это дора» . Гугла ввела, не за горами и остальные. Такая «метка» бла – это совсем не та блажь, что со спец тыглом, который приняли для обозначения модераторами на форумах спамовых мессаг. Такую метку может заработать и приличный сайт, случайно естественно, коль не знает за какие глаза её дают.
Как же обстоят дела сейчас с этим?
Прошу всех высказаться, кто имеет свои мысли и соображения, о состоянии использования ява скриптов поисковиками при индексации и расчёте релевантности страниц/сайтов.
И конечно, классно было бы, если бы все могли мысли подкрепить аргументами (примерами, если не сложно). Конечно, если малёхо выскажутся (освятят свой опыт) такие личности как ГринВуд, Интеритус, Иван Севостьянов, Андрей Иванов, Женя Трофименко и Саша Садовский, то аргументов никаких собственно и не нужно, посему как любое их слово, можно считать, аргументом Последний, правда, крайне мало стал высказываться по понятным причинам
Надеюсь, вопрос/тема интересна многим, потому как многие сайты весьма и весьма усердно используют ява скрипы для оптимзации под поисковики, концепции архитектуры и навигации строятся на этом, и с использованием этого. Благо пользователи узают яву почти все на 100% (аборигенов не считаем ). Жизнь хороша, если жить не спеша. - Возможно какие-то наработки у поисковиков есть, но полноцено "понять" java-скрипт они не смогут, это же язык програмирования, обратная декомпиляция всегда сложна и жрет много ресурсов, теперь представь что это надо сделать во всем объеме интернета, ресурсов не хватит. Дешевые домены за Webmoney - Зависит от сложности ява-скрипта. Какие-нибудь простыи и стандартные, поисковики возможно и начали понимать, а что касается более сложных -- так это настолько сложно (а порой и невозможно), что врядли они будут этим заниматься. - Ну, нашему Яне может и не хватит, он за пределы рунета ни шагу. А вот Гугля!? Он же лидер, значит должен быть впереди планеты всей. Проблем с мощностями для индексации и прочими операциями у Гугла не припоминаю.
Что значит «простые и стандартные» и что есть другие? Редирект – это стандартно? Конкретно какие? In searching Good luck, Google - ну ява-скрипт это не компилируемый язык, а интерпретируемый.
что мешает прикрутить к роботу скажем модуль мозиллы, который занимается интерпретированием? к тому же он опен сорс. - По моему скромному мнению, проблема не в интерпретации, а в переборе все вариантов работы скрипта, т.е. в переборе всех операций, которые потенциально может сделать пользователь. Учитывая то, что вариантов может быть очень много, резко возростает количество обрабатываемых страниц, а как следствие и мощностей надо намного больше. Когда предыдущие авторы говорили о стандартных, это можно понять, как простенькие скрипты, которые применяют все кому не лень (можно считать, что они стандартны) и самое главное, у этих скриптов очень мало вариантов действий пользователя.
Приведу пример. Допустим есть скрипт, который обрабатывает ответы на вопросы теста и в зависимости от того, что он там насчитал, выдает результаты. Если вопросов будет всего 4 с однозначными ответами да-нет, то вариантов уже будет 16. А если вопросов будет 10 или 20, а еще варианты ответов будут даже не да-нет-незнаю, а еще пару тройку, количество комбинаций составит несколько десятков или даже сотен тысяч и все это добро надо обработать.
Пример утрированный, так никто не делает, но суть проблемы я думаю понять можно. УМ -Ужасный Миха.
Посетите мой Нумизматический портал - То же, что мешает (мешало) индексить динамику (сессии). Мозиллу, пожалуй, не прикручивают, но интерпретацию делают.
Вопрос для поисковика не в том, чтобы всё перелопатить и загрузить себя вычислениями по самое не хочу, в тупую наращивая вычислительные мощности, а в том по каким критериям ему определиться, какую яву и т.п. обсчитывать, а что нет? Ведь задача поисковика - дать релевантный результат на запрос. Точнее не сколько релевантный запросу, сколько - желанию юзера (несколько разное), чтоб поисковик нравился юзеру и чтоб следующий раз юзер приходил юзать именно его и смотрел ...рекламу... Это и так всем понятно.
Поисковик борется за качество обслуживания, а поэтому вынужден чётко определять, когда ему вешают лапшу на уши, а когда всё путём.
Воо! Здесь видимо собака и порылась.
Почему не взять за критерий «яву не требующую действий пользователя»? Т.е. ту, которая исполняется браузером пользователя без желания последнего. Моделировать видимость сайта как для пользователя без активных действий последнего. Вычислений нужно будет делать существенно больше – не сомненно, но ведь раньше и флешь, пдф и имидж карты не индексили, а сейчас индексируют. Для поисковика сперва нужно качество (ответов на запросы), а потом только количество (во я какой крутой проиндексил только рунет ). Они без проблем будут жертвовать полнотой индексации инета в угоду тому, чтобы «быть релевантными» своему юзеру. Жизнь хороша, если жить не спеша. - Попробуйте написать автомат для распознования дорвеев - поймете, что не очень-то и просто парсить Жабу. - т.е. ваше мнение - поисковики с явой не связываются и не обрабатывают/парсят/интерпретируют. Потому как это для них крайне тяжело. Я правильно понял ваше мнение? Жизнь хороша, если жить не спеша. - Не совсем. Я бы сказал так: в простейших случаях можно заставить бота перейти по js-ссылке. Однако, в общем случае задача довольно таки сложно решаема, если решаема вообще. Уж больно изощренными способами можно сделать ссылку. - Вопрос для поисковика не в том, чтобы всё перелопатить и загрузить себя вычислениями по самое не хочу, в тупую наращивая вычислительные мощности, а в том по каким критериям ему определиться, какую яву и т.п. обсчитывать, а что нет? Ведь задача поисковика - дать релевантный результат на запрос. Точнее не сколько релевантный запросу, сколько - желанию юзера (несколько разное), чтоб поисковик нравился юзеру и чтоб следующий раз юзер приходил юзать именно его и смотрел ...рекламу... Это и так всем понятно.
Поисковик борется за качество обслуживания, а поэтому вынужден чётко определять, когда ему вешают лапшу на уши, а когда всё путём.
Согласен, но то о чем вы говорите - это уже второй этап по моей классификации. Сначало перебрать все варианты - это уже сложно, а потом еще отсеять мусор и выбрать наиболее полезные, хотя это как раз наверное не самое сложное, ведь поисковики это делают каждый день с обычными страницами. Проблема на мой взгляд состоит еще в том, что не на каждую страницу результатов можно попасть набрав прямую ссылку. Если хранятся какие-то данные на стороне сервера, то к такой странице обратится на прямую будет нельзя. Например в результате какого-то долго выбора, формируется сложный запрос в MySQL, который формирует результаты, но так как таблица большая, она сохраняется во временную таблицу и просматривается кусками. Когда был поисковик, временная таблица существовала, или результаты могли быть сформированы в процессе. Когда придет пользователь, временной таблицы уже нет или она очищена. Такие варианты встречаются очень редко, но как с ними быть. УМ -Ужасный Миха.
Посетите мой Нумизматический портал - to УМ
Что то сильно тяжёлое вы замутили, не понял я вашу мысль.
А все этапы вашей классификации узнать можно? In searching Good luck, Google - Как заставить? Вот например простая ссылка впихнутая в яву, бот по ней перейдёт или нет?
Хорошо, предположим перейдёт. Дальше хуже.
Вес он по ней передаст или нет?
А слова в ссылке учитывать будет или нет, вес им придавать?
По каким типам ява ссылок он это будет делать а по каким нет, т.е. на сколько ссылка на ява должна быть сложной, чтоб бот SE в ней не разобрался. Ведь если раньше утверждалось, что с помощью ява ссылки можно закрыть нежелательные ссылки и разрулить по сайту PR, то сейчас получается всё - приехали.
У кого мысли есть? Жизнь хороша, если жить не спеша. -
Да все просто, сначало перебрать все варианты, потом проиндексить каждый из них. Со вторым проблем нет, и вопрос о определении нужности тоже не стоит, сейчас же не возникает проблем у поисковиков с определением релевантности.
Все проблемы с первым этапом. Помимо того, что вариантов может быть очень много и придется провести слишком большое наращивание вычислительных мощностей для индексации, не к каждой странице имеется возможность обратится на прямую, т.е. пользователь в поисковике нажмет на ссылку, но вместо ожидаемого результата, он попадет на главную страницу ресурса или еще куда-нибудь.
Наиболее близкий пример можно привести - Wizard'ы, вы постепенно заполняете окошки и в конце концов получаете то, что хотели в соответствие с тем, что вы заполнили. В большинстве случаев, то что вы заполняете, сохраняется в сессии и передается через cookies. Однако это возможно, если в конце заполнения Wizard'ов стоит простейшая выдача нужного документа в соответствии с тем, что вы ввели или простейшие вычисления. Однако, если в конце заполнения wizard'ов стоят сложные расчеты, по которым ведется сложный поиск в базе данных размерами в сотни мегабайт, то дело очень сильно осложняется. Для того, чтобы уменьшить нагрузку на сервер, чтобы при получении следующей порции результатов не проводить все расчеты и поиски заного, обычно создают временную таблицу, в которую складывают все результаты и затем не тратя времени на перерасчеты, результаты выдают из этой таблицы. Т.к. таблица временная, то она хранится ограниченное количество времени, после чего уничтожается. Вот и получается, когда поисковик индексил, таблица из которой ему были выданы результаты была, а когда через пару дней по этой ссылке перейдет пользователь, этой таблицы уже нет и пользователь ничего не получит.
На сколько я понимаю, в subscribe сейчас статистика сделана именно так. Сначало надо ее сформировать, а потом уже просматривать. Только там в последний раз сформированная статистика не уничтожается. УМ -Ужасный Миха.
Посетите мой Нумизматический портал - "Заставить" - это я про программистов поисковиков.
Вообще, логичными выглядят такие рассуждения - если паук перешел по js-ссылке, то она должна считаться равнозначной обычной.
И соотвественно, вес итп распределять точно так же как и с обычной.
Либо давать ей меньший вес, исходя из принципа, что часто ссылки ведут на счетчики итп... Хотя если считать, что часто на js делаются разделы меню, то... В общем, это забота поисковиков.
А вот со сложностью реализации перехода все более-менее ясно.
Ссылку вида <a href='javascript:window.location="page.html"'> программно распознать можно и перейти по ней пауку тоже теоретически можно. А вот распознать, куда ведет ссылка <a href='javascript:gotolink(1)'> значительно сложнее. Особенно, если
описание gotolink() находится во внешнем сайте, а выбор конкретной ссылки для перехода происходит через выполение каких-либо условий.
Интернет казино
Онлайн игры
Купить DVD
Другие сайты
|