Какие типы файлов может индексировать Google и Yandex

Google

Поисковые боты Googlebot способны, без каких либо трудностей, сканировать большинство типов файлов. Ниже представлен перечень наиболее распространенных из них:

Adobe PDF (*.pdf)  кроссплатформенный формат электронных документов
Adobe PostScript (*.ps файл языка программирования PostScript или языка разметки страниц
Autodesk Design Web Format (*.dwf) безопасный формат файлов для обмена проектными данными для печати, просмотра или рецензирования
Код Basic (*.bas) формат файла языка программирования Basic
Код C/C++ (*.c, *.cpp, *.cxx, *.h, *.hpp) форматы файлов языков программирования C и C++
Flash (*.swf) стандартное расширения для Flash-файлов
Google (*.kml, *.kmz) язык разметки для представления трехмерных геоданых в программе Google Earth
HTML (*.htm, *.html) файлы стандартной разметки документов в интернете
Perl (*.pl) файлы языка программирования Perl
Python (*.py) файл исходного кода программ высокоуровневого языка программирования Python
Java (*.java) исходный код языка программирования Java
Microsoft Exel (*.xls, xlsx) формат стандартных рабочих книг Exel
Microsoft PowerPoint (*.ppt, *.pptx) формат файлов для программы создания презентаций PowerPoint
Microsoft Word (*.doc, *.docx) формат файлов текстового редактора Word
OpenOffice (*.odt) формат файлов текстового редактора в OpenOffice
OpenOffice (*.odp) формат файлов для программы создания презентаций в OpenOffice
OpenOffice (*.ods) формат стандартных рабочих книг электронных таблиц в OpenOffice
Текстовые форматы (*.rtf, *.wri, *.ans, *.asc, *.cas, *.txt, *.text текстовые форматы
XML (*.xml) файл расширяемого языка разметки XML
(*.wml, *.wap) файлы разметки для беспроводных устройств.

 Если в поиске использовать оператор filetype (например, filetype:xml ноутбук), то в результатах будут только файлы расширения *.xml, при этом в результатах не будет файлов типа XML. Некоторые страницы вообще не имеют расширения (например, http://excalibur.com.ua). Иногда расширения страницы не соответствует типу файла.

  

Yandex

Поисковые боты Yandex bot способны, без каких либо трудностей, сканировать большинство типов файлов. Ниже представлен перечень наиболее распространенных из них:

Microsoft Word (*.doc, *.docx) формат файлов текстового редактора Word
Adobe PDF (*.pdf) кроссплатформенный формат электронных документов
Flash (*.swf) стандартное расширения для Flash-файлов
Microsoft Exel (*.xls, xlsx) формат стандартных рабочих книг Exel
Microsoft PowerPoint (*.ppt, *.pptx) формат файлов для программы создания презентаций PowerPoint
OpenOffice (*.odt) формат файлов текстового редактора в OpenOffice
OpenOffice (*.odp) формат файлов для программы создания презентаций в OpenOffice
OpenOffice (*.ods) формат стандартных рабочих книг электронных таблиц в OpenOffice
Текстовые форматы (*.rtf, *.txt) текстовые форматы

 

Примечание. В документах типа PDF индексируются только текст, картинки нет. Во Flash к индексации допускается текст в блоках:


DefineText,
DefineText2
DefineEditText
Metadata.

,а ссылки в блоках:

DoAction
DoAction
DefineButton2.

Документы размером свыше 10Мб не индексируются.

Добавлено : 2010-09-21 22:42
Автор : rznasa
Просмотры : 556

Авторизация

 
© 2009-2010 Портал о создании и продвижении сайтов :: EXCALIBUR. Всі права захищено.