Работа с интернет ресурсами что это

Опубликовано: 17.09.2024

Наблюдай внимательно за природой, и ты будешь всё понимать намного лучше.

Альберт Эйнштейн

Вопросы к экзамену

Для всех групп технического профиля

Лекция 07. Информационные ресурсы сети Интернет

  • Печать
  • E-mail

В настоящее время интенсивно развивается Интернет - компьютерная сеть, охватывающая весь мир. В архивах свободного доступа сети Интернет можно найти информацию по всем сферам человеческой деятельности, начиная с новых научных открытий до прогноза погоды на завтра. Кроме того, Интернет предоставляет уникальные возможности дешевой, надежной и конфиденциальной глобальной связи по всему миру.

Пользователи Internet получают информацию в виде гипертекста, являющегося основным способом представления данных. Термин Гипертекст, применяемый в последнее время в сочетании с прилагательным мультимедийный, означает документ, содержащий текстовые, звуковые и изобразительные фрагменты. Особенностью такого документа является наличие выделенных ключевых слов, всякого рода кнопочек и иконок, щелчки по которым воспроизводят соответствующие фрагменты, которые могут и не входить в состав данного документа, а находиться в памяти другого компьютера. Выделенные поля, активизация которых вызывает отображение следующих кадров, представлены в гипертекстовом документе ссылками на соответствующий фрагмент в пределах файловой системы данного компьютера или адресами URL для вызова недостающих компонентов из сети. Идеи гипертекста в том или ином виде присутствуют в различных справочных системах, в частности в системе помощи Windows всех версий (Help-система). Для описания гипертекстовых документов в Internet используется специальный язык HTML - HyperText Markup Language. Таким образом, можно сказать, что гипертекст - это многостраничная информация различного вида, связанная в различных страницах многочисленными ссылками.

Несмотря на то, что современные навигаторы «понимают» наиболее распространённые протоколы, в сетях постоянно возникают новые изобразительные средства. Навигаторы начинают разбухать, но угнаться за валом этих нововведений они не могут. Поэтому в 1994 возникла идея создания алгоритмического языка интерпретирующего типа, на котором можно было бы писать «проигрыватель» документа любого формата. Так в мае 1995 в компании Sun Microsystems появился язык Java, интерпретаторы с которого были реализованы на большинстве вычислительных платформ сети Internet. На этом языке пишутся приложения для Internet - апплеты, которые могут исполняться на любом компьютере, снабжённом Java-интерпретатором.

В настоящее время Internet не является отдельной сетью – на самом деле это сообщество сетей (именно поэтому Internet называют "сетью сетей"), в которое сейчас входит более 2 миллионов компьютеров во всем мире. И если вы подключены к сети, являющейся частью Internet, то вы имеете доступ к ресурсам любого из них.

Все программное обеспечение, которым можно пользоваться для работы в сети Интернет, можно поделить на две части. Это телекоммуникационные пакеты и абонентское программное обеспечение для работы в сети Интернет.

Телекоммуникационные пакеты используют для подключения к хосту сети, пользуясь обычными телефонными линиями. При этом пользователю предоставляется возможность работы на одном из хостов сети в режиме online, т.е. он может пользоваться всеми ресурсами узла сети так, как если бы он работал на его терминале.

Абонентское программное обеспечение обеспечивает обслуживание процессов получения и просмотра информации абонентом сети Интернет. Среди огромного количества программ этого назначения наиболее широко известны web-обозреватели Internet Explorer, Opera и Mozilla, пакеты обслуживания почты и новостей Eudora, службы Microsoft Outlook, Outlook Express и др.

Информационный ресурс — это данные в любом виде, которые можно многократно использовать для решения проблем пользователей. Например, это может быть файл, документ, веб-сайт, фотография, видеофрагмент. Для информационных ресурсов в Интернете характерно определённое время жизни и доступность более чем одному пользователю.

Также информационным ресурсом можно назвать отдельно взятый сайт, портал или несколько интернет-проектов. Информационный ресурс в Интернете может быть узкой (специализированной) направленности (например онлайновый словарь или сайт биржевых новостей), или общетематический.

Поиск информации в Интернете

Если ваш компьютер имеет подключение к Интернету и на нем установлена программа просмотра web-страниц – браузер (например, в операционной системе Windows стандартное приложение Интернет Explorer), то у вас есть возможность поиска информации в Интернете из любого места на компьютере. Такая возможность обеспечивается наличием в Интернете поисковых серверов.

Поиск в сети – непростое занятие, которое зачастую занимает много времени и не приводит к желаемому результату. Причины затруднений при поиске информации в сети разнообразны и зависят как от личности «следопыта», так и от наличия и принципа организации данных в сети Интернет. Начиная поиск, необходимо понимать, во-первых, что Вы хотите найти, во-вторых, основные принципы работы в глобальной сети.

Поисковыми серверами называют выделенные компьютеры, которые автоматически просматривают все ресурсы Интернета и индексируют их содержание.

Затем вы можете передать такому серверу фразу или набор ключевых слов, описывающих интересующую вас тему, и сервер возвратит вам список ресурсов, соответствующих вашему запросу. Таких серверов существует довольно много, например: Google (www.google.com), Yahoo! (www.yahoo.com); российские поисковые серверы: Rambler (www.rambler.ru), Яндекс (www.yandex.ru) и др. Если в Интернете есть информация, которая вас интересует, то ее наверняка можно найти при помощи поисковых серверов.

Задавая образ поиска в поисковой системе, следует иметь в виду, что алгоритмы поиска информации в сети, подобно поиску информации в базе данных, основаны на логике. Перед вводом запроса нужно его обдумать. Чем конкретней задана тема поиска, чем уникальней сочетание слов, тем больше вероятность получения верного, быстрого и лаконичного ответа. Необходимо обратить внимание на необходимость использования поискового языка. Разные поисковые системы «говорят» на сходных языках, но имеют свои «диалекты». Один и тот же поисковый запрос (сочетание слов, отвечающее интересующей Вас информации) в разных поисковых системах может быть понят по-разному. Знакомясь с поисковыми системами, необходимо обратить внимание на ввод специальных символов, с помощью которых можно отмечать слова, которые ОБЯЗАТЕЛЬНО должны присутствовать в результатах поиска (обычно это знак +) или, которые НЕ ДОЛЖНЫ БЫТЬ среди результатов (обычно это знак -). Это поможет быстрее найти данные.

1. Несколько ключевых слов, разделенных пробелом, соответствуют операции логического сложения: ИЛИ (OR). Например, указав ключ: <Школьная информатика>, мы получим список всех документов, в которых встречается слово «Школьная» или слово «информатика».

2. Несколько слов, заключенных в кавычки, воспринимаются как единое целое. Например, «Школьная информатика».

3. Знак + между словами равносилен операции логического умножения: И (AND). Указав в запросе ключ <Школьная + информатика>, получим все документы, в которых имеются эти два слова одновременно, но они могут быть расположены в любом порядке и в разброс.

Нахождение информационных ресурсов в каталогах. В каталогах Интернета хранятся тематически систематизированные коллекции ссылок на различные сетевые ресурсы, в первую очередь на документы World Wide Web. Ссылки в такие каталоги заносятся не автоматически, а их администраторами. Занимающиеся этим люди стараются сделать свои коллекции наиболее полными, включающими все доступные ресурсы на каждую тему. В результате пользователю не нужно самому собирать все ссылки по интересующему его вопросу, но достаточно найти этот вопрос в каталоге - работа по поиску и систематизации ссылок уже сделана за него.

Каталоги обычно имеют древовидную структуру и похожи на очень большой список закладок. Когда World Wide Web только начинала развиваться и ее серверы еще можно было пересчитать, некоторые пользователи вели их списки. Со временем WWW-серверов становилось все больше, каждый день появлялись новые, и механизма закладок стало недостаточно для того, чтобы хранить эту информацию. Некоторые пользователи WWW стали создавать специальные программы для поддержания базы данных по ссылкам на ресурсы Интернета, ее автоматической синхронизации и управления ею. Именно так и родились глобальные каталоги сети, как, например, Yahoo! (www.yahoo.com), Lycos (www.lycos.com), российский каталог ресурсов List (www.list.ru) и др.

Как правило, хорошие каталоги сети Интернет обеспечивают разнообразный дополнительный сервис: поиск по ключевым словам в своей базе данных, списки последних поступлений, списки наиболее интересных из них, выдачу случайной ссылки, автоматическое оповещение по электронной почте о свежих поступлениях.

Существуют также специализированные поисковые серверы:

1. Поиск E-mail, адресов и людей/компаний: Fourl I Directory, Lookup, Nynex Inreactive Yellov Pages for business, Phone Directory.

2. Поиск программного обеспечения: FTP Search, Snoopie, Jumbo.

3. Поиск в телеконференциях: DejaNews.

4. МЕТАПОИСК-универсальный метод поиска: SavvySearch, All-in-One Search Page, Metasearch, Searchers, Starting Pointmetasearch, W3 Search Engines.

На многих информационных серверах имеются ссылки на такие поисковые серверы.

Поиск информации на отдельном web-узле. Каждому пользователю Интернета часто приходится решать задачу поиска информации на отдельном web-узле. Если вы связываетесь с Интернетом через модем, то, очевидно, что чем больше вы тратите времени на поиски, тем дороже стоит получаемая информация. Следовательно, умение быстро разобраться в структуре узла и способах навигации (т.е. путей перемещения с одной web-страницы узла на другую) становится полезным навыком.

Для быстрого поиска информации на web-узле можно предложить следующие варианты:

а) путем начального задания адреса вручную в строке URL(Адрес) или выбора документа из списка истории браузера (программы просмотра web-страниц), если таковая уже накоплена;

б) по гипертекстовым ссылкам;

в) по каталогам узла с помощью обрезания строки ранее введенного адреса (URL), последовательно поднимаясь от каталога к каталогу вверх к корню сервера.

Один из самых эффективных способов ускорения работы с web-страницей - это активное использование средств автоматического поиска. Такой подход особенно практичен для многоэкранных страниц с информационных узлов, когда визуальное ознакомление с материалом становится слишком трудоемким. Поиск на странице можно произвести по терминам, введенным в специальный поисковый шаблон, который активизируется в браузерах клавишами Ctrl+F или через меню Правка-Поиск на этой странице или нечто подобное.

1. Поиск на web-странице всякий раз проводится вверх или вниз по странице в зависимости от указания направления в шаблоне, начиная с начала (если вниз) или с конца документа (если вверх), независимо от того, какая часть страницы отображается на экране на момент начала поиска.

2. Допустимо введение в шаблон не только единичного термина, но и фразы, что делается одной строкой без использования специального синтаксиса. Специальная пометка в шаблоне позволяет искать с учетом регистра символов.

3. Найденное слово или фраза выделяются в тексте, и происходит автоматическое перемещение к их местоположению, однако выделенное поле не всегда можно наблюдать.

4. Если при старте поиска уже есть выделенная область текста, то поиск начинается именно с нее в заданном в шаблоне направлении, само содержимое выделенного поля участия в поиске уже не принимает, так же как и оставшаяся часть страницы. Отметим, что всякий раз, когда поисковая процедура закончена, на странице остается выделенная область текста, соответствующая последнему совпадению. Если необходимо выполнить поиск с новыми терминами, то следует сначала снять уже существующее выделение кликом мыши в любой точке текста, иначе в новом поиске будет участвовать только часть страницы вверх или вниз от выделенной области в зависимости от направления, заданного в шаблоне.

5. Надписи, выполненные в графике, не откликаются на поисковые запросы.

На многих серверах предусмотрена страница, которая предлагает более детальное изложение его содержания, чем основное меню. Такая страница называется «Карта сервера» («Sitemap»).

Аналогично используют функцию поиска по странице для того, чтобы найти ссылку на локальную поисковую машину, если она организована разработчиком узла. Тогда после нажатия Ctrl+F следует ввести в шаблон слово «поиск» («search»), и ссылка будет найдена в течение секунды.

Еще одно замечание сделаем относительно возможности еще до нажатия на гиперссылку отследить адрес (URL), по которому она осуществит переход. Когда указатель мыши встает на ссылку (без нажатия), то в строке состояния браузера появляется соответствующий адрес. Эту информацию можно использовать для предварительной оценки целесообразности такого перехода, она также полезна и в случае применения разработчиком специальной графической карты гипертекстовых ссылок (UsemapClientSide), когда отдельные фрагменты сомкнутой воедино картинки могут являться ссылками на различные ресурсы.

Работая в сети Интернет, не забывайте, что Вы имеете дело как с людьми, так и с машинами. Причем не в самом лучшем проявлении тех и других. Люди часто оформляют информацию так, как им нравится, а не так, как многим удобно. А машины БУКВАЛЬНО разыскивают те слова, которые Вы им задаете, не понимая, что, например, по запросу «клетка» следует искать клетки для канареек.

Глобальная сеть – очень подвижная система, которая постоянно меняется и по структуре, и по содержанию. Там, где сегодня Вы нашли массу интересной информации, завтра Вы ее можете не увидеть. Адреса сайтов могут со временем изменяться.

Путеводитель по интернет ресурсам (примеры информационных ресурсов сети Интернет):

Глобальная сеть Интернет обладает огромным потенциалом, который специалисты компании Google оценивают в 1 трлн веб-страниц. Структура Интернета такова, что пользователь может воспользоваться веб-ресурсами, адрес которых ему известен, или поисковыми системами для поиска неизвестных ему веб-сайтов. По сути, единственным средством доступа к деловым ресурсам Интернета являются поисковые системы. Задача эффективной работы с ресурсами Интернета во многом определяется эффективностью поиска информации.

Поиском информации в Интернете занимаются поисковые машины и каталоги. Задача поисковых систем – опознать веб-страницы с помощью поиска по ключевым словам в базе данных, которая состоит из индексов и ссылок на веб-страницы.

Каталоги представляют собой иерархически организованную тематическую структуру, в которую в отличие от поисковых машин информация заносится по инициативе пользователей. Добавляемая страница должна быть жестко привязана к принятым в каталоге категориям. Каталоги не столь популярны у пользователей, как поисковые машины поскольку представленный объем информации в несколько десятков тысяч раз меньше, а также из-за трудностей в навигации по разделам. Практически каждый из 700 каталогов, представленных в Интернете, предлагает собственное видение структуры разделов и рубрик. Неоспоримым преимуществом каталогов перед поисковыми машинами является более высокая эффективность результатов поиска, поскольку веб-сайты выбираются из соответствующих разделов.

Поисковые системы состоят из трех основных частей:

1. Спайдеры (Spider, Crawler, Robot) – программа, которая систематически посещает веб-сайты, считывает и индексирует полностью или частично их содержимое и далее следует по ссылкам, найденным на сайте.

2. Поисковая база данных (так называемый индекс) представляет собой гигантское хранилище информации – индексов, ссылок на веб-страницы и другой разнообразной информации.

3. Поисковая программа, которая в соответствии с запросом пользователя перебирает индексы в поисках соответствующей информации и выдает результаты поиска в виде ранжированного списка найденных веб-документов. Место в списке определяется тем, насколько полно тот или иной документ отвечает критериям, указанным в запросе пользователя.

В каждой поисковой системе работает собственный спайдер; каждая система индексирует страницы своим особым способом, и приоритеты при поиске по индексам тоже различны. Поэтому запрос по ключевым словам или выражениям в разных поисковых системах обычно дает разные результаты.

Программа поиска отыскивает страницы, которые соответствуют формальным требованиям запроса. Для того чтобы определить последовательность, в которой отобранные страницы будут представлены пользователю, применяется, как правило, уникальный для каждой поисковой системы алгоритм ранжирования. В интересах пользователя документы, наиболее соответствующие потребностям пользователя, должны быть помещены первыми в списке. Различные поисковые системы используют свои алгоритмы ранжирования. Основными принципами определения соответствия документов запросу являются следующие:

· количество слов запроса в текстовом содержимом документа;

· местоположение искомых слов в документе;

· удельный вес ключевых слов в общем количестве слов документа;

· дата – как долго страница находится в базе поискового сервера;

· индекс цитируемости – как много ссылок на данную страницу ведет с других страниц, зарегистрированных в базе поисковика.

Поисковые машины оказывают услуги пользователям бесплатно. Между тем поиск информации в Интернет является большим бизнесом, в котором участвует около 2000 поисковиков, поскольку проблема поиска актуальна не столько для пользователей, сколько для создателей веб-сайтов, заинтересованных в привлечении внимания пользователей Интернета. Для огромного количества интернет-магазинов, веб-сайтов других коммерческих компаний поисковые машины становятся практически единственным инструментом привлечения пользователей. Таким образом, поиск информации в Интернете становится эффективным инструментом рекламы по привлечению новых клиентов. Динамика темпов роста рынка рекламы по средствам массовой информации отображена на рис 5.3.




Рис. 3 Темпы роста рынка рекламы в СМИ, 2008г. Источник: Radio/Magazines/TVs: “Grown up digital” by Don Tapscott, 2009, McGraw-Hill. p. 30.

Российский рынок интернет-рекламы в 2008 г. вырос на 55%, до 14,7 млрд руб., в том числе: сегмент контекстной рекламы (тематические ссылки в результатах поиска и на профильных ресурсах) вырос на 61% до 8,9 млрд руб.; сегмент медийной рекламы (баннеры, «всплывающие окна» и другие форматы) за год вырос на 45%, до 5,8 млрд руб[6].

На мировой арене поиска лидирующую позицию занимает компания Google, основанная в 1998 г., штат сотрудников составляет более 10 тыс., предлагает около 160 бесплатных сервисов на 114 языках мира. Другими крупными игроками являются компании Yahoo! и Microsoft.

Поисковые машины должны находить компромисс между удовлетворением результатами поиска пользователей и рекламодателей. Однако говорить об эффективном поиске в Интернете невозможно. Эффективность работы поисковых машин ограничивается тремя существенными факторами:

1. Топология Интернета такова, что поисковые машины могут просматривать не больше 1/3 всех сайтов в Интернете.

В 2000 г. специалисты компаний AltaVista, IBM и Compaq исследовали ресурсы и ссылки во Всемирной Паутине[7]. Просмотрев с помощью поисковых средств AltaVista свыше 600 млн веб-страниц и 1,5 млрд ссылок, размещенных на этих страницах, они пришли к выводу что исследуемое пространство состоит из следующих компонентов:

· центральное ядро – это тесно связанные между собой веб-страницы, с каждой из которых можно попасть на любую другую (27%);

· отправные страницы, в которых могут быть ссылки, ведущие к ядру, но из ядра к отправным страницам попасть нельзя (22%);

· конечные веб-страницы, к которым можно прийти по ссылкам из ядра, но к ядру из них попасть нельзя (22%);

· полностью изолированные от центрального ядра страницы (22%);

· веб-страницы, не пересекающиеся с остальными ресурсами Интернета (7%).

Исследования показали, что при увеличении общего объема информационных ресурсов Интернета, установленные отношения компонентов остаются прежними. Проведенный анализ позволяет сделать вывод о том, что информационное пространство Интернета является достаточно сложным и неоднородным. К отдельным ресурсам Интернета поисковые машины не имеют доступа. Для индексирования поисковым машинам доступны веб-страницы, составляющие центральное ядро, т.е. не более 30% всех веб-страниц.

2. «Глубинный Интернет» (скрытый или невидимый). В нем находятся базы данных информационных агентств, доступ к которым осуществляется на условиях подписки, т.е. оплаты, а также веб-ресурсы, доступ к которым осуществляется на условиях регистрации. Специалисты по поиску информации считают, что глубинный Интернет более чем в 500 раз превышает число документов, относящихся к «видимой» части. Таким образом, в доступной поисковым системам части Интернета содержится не более 0,5% информационных ресурсов, представленных в Интернете.

3. Поиск информации в Интернете, как правило, проводится по ключевым словам, поскольку информация, хранящаяся в Интернету, разрозненна и неструктурированна. В связи с тем, что в средствах поиска в Интернет не используются информационно-поисковые языки, на которых должны были бы описаны исходные документы и запросы, полнота поиска в Интернете с учетом описанных выше поисковых средств будет значительно ниже, чем в документальных системах, построенных на базе информационно-поисковых языков.

Первые полнотекстовые информационно-поисковые системы (Full Retrieval System) появились в 1960-х гг.. Назначением этих систем был поиск в библиотечных каталогах, архивах, массивах документов, таких как статьи, нормативные акты, рефераты, диссертации, монографии. Первоначально информационно-поисковые системы применялись преимущественно в библиотечном деле и в системах научно-технической информации.

В начале 1970-х гг. уже коммерческие компьютерные службы начали предоставлять возможность интерактивного поиска в тематических базах данных. Некоторые из тех служб существуют и сегодня – основанная в 1965 г. система Dialog обеспечивает своим клиентам доступ к 900 базам данных и является одной из наиболее эффективных информационных служб.

Одними из наиболее важных показателей эффективности информационных систем, содержащих текстовую информацию, являются семантические показатели. Семантические показатели основаны на оценке релевантности между документами и запросами.

При описании технологии обработки информации в Интернета часто употребляется термин «релевантность». Очевидно, что этот термин применительно к оценке эффективности поиска в деловых ресурсах Интернета использовать нельзя. Определение релевантности предполагает, что группа экспертов просматривает весь массив (в данном случае массив деловых ресурсов Интернета) и определяет, какие из документов, хранящихся в массиве, релевантны запросу. Учитывая объем деловых ресурсов Интернета – в середине 2008 г. Он превысил 1 трлн веб-страниц, – просмотр такого массива технически не реализуем. Под полнотой выдачи сведений из деловых ресурсов Интернета следует понимать произведение средней доли просматриваемых сайтов в поисковых системах на среднюю долю «видимой» части сайта в деловых ресурсах Интернета.

Где П1– средняя доля просматриваемых сайтов;

П2 – средняя доля видимой части сайта.

Проведенные ранее исследования показали, что полнота в вербальных информационно-поисковых системах (поисковых системах Интернета) не может быть выше 50%.

Указанная полнота поиска в ресурсах Интернета была бы 50%, если бы просматривался весь массив информации, находящейся на сайтах. Это максимальное значение необходимо корректировать на долю просмотра веб-страниц поисковыми машинами. Учитывая, что, по данным исследований компетентных в этой области организаций, лучшие поисковые системы Интернета просматривают не более 30 % веб-сайтов и при этом на каждом сайте просматривают только «видимую» часть (1%-5% объема сайтов), полнота поиска в Интернете с помощью поисковых систем составит менее 1%. Отсутствие публикаций, посвященных результатам количественного анализа характеристик поиска информации в Интернете по полноте выдаваемой информации и информационному шуму, вводит потребителя в заблуждение. Потребитель, как правило, не представляет, что объем не выданной, но удовлетворяющей потребителя информации, на два порядка превышает объем выданной. Если вы получили в ответе на запрос 10 документов, вы должны знать, что 990 документов, удовлетворяющих условиям запросов, остались не выданными. Эти оценки представляются даже завышенными, так как половина документов в Интернете на английском языке, а остальные документы на языках других народов мира.

Анализ содержимого профессиональных баз за последние 15 лет показывает неуклонный рост доли текстовой информации в общем объеме информации профессиональных баз. Если в 1985 г. доля текстовой информации составляла 47%, то в 2000 г. – уже 84%. Представляется, что основная информация в Интернете также является текстовой. Эти обстоятельства позволяют сделать вывод о том, что подходы к оценке эффективности поиска в документальных системах в полной мере распространяются и на профессиональные базы, и на информационные ресурсы Интернета.

С появлением и развитием вычислительной техники в разных странах начались исследования, связанные с оценкой возможности выявить автоматически смысл из текста. Эти исследования велись в рамках направления, получившего название «машинный перевод» и в рамках направлений по автоматизированной обработке, если входной поток сообщений включал произвольные тексты. В 1975 г. известный специалист в области компьютерной лингвистики профессор Г.Г. Белоногов сформулировал концепцию фразеологического машинного перевода текстов, которую опубликовал в предисловии к книге Д.А. Жукова «Мы переводчики»[8]. Главным тезисом этой концепции является утверждение, что при переводе текстов в качестве основных единиц смысла следует рассматривать не отдельные слова, а фразеологические сочетания, выражающие понятия, отношения между понятиями и типовые ситуации. Отдельные слова также могут использоваться, но во вторую очередь. Целью передачи информации с помощью текста, как пишет Г.Г. Белоногов[9], является не столько исчерпывающее описание мыслительных образов его автора, сколько инициация процесса порождения соответствующих мыслительных образов у читателей. Поэтому текст не столько «выражает», сколько стимулирует и «намекает», и значительная часть его содержания оказывается «между строк».

Воссоздание в сознании читателей мыслительных образов, подобных мыслительным образам автора текста, осуществляется постепенно, путем восприятия предложения за предложением и «монтажа» возникающих при этом частичных образов в целостный мыслительный образ, соответствующий содержанию текста. Теоретические положения лингвистики, компьютерной лингвистики и многолетние эксперименты, проведенные на реальных текстах, неопровержимо доказывают истинность таких выводов.

Единственно-верное заключение, которое можно сделать, рассматривая процесс коммуникации между источником и потребителем информации с позиций теоретических положений лингвистики и компьютерной лингвистики состоит в том, что без участия человека выявить смысл из произвольного текста невозможно.

Современное общество невозможно представить без сети Интернет. Каждый раз, заходя на определенные страницы или попросту сидя в социальных сетях, мы не задумываемся о специальной терминологии и о разнице определенных, привычных нам вещей. В данной статье разберемся, что же такое, собственно, веб-сайт и веб-ресурс, какие виды веб-ресурсов существуют, и в чем их особенности. Если же вы хотите самостоятельно научиться создавать веб-сайты, приглашаем вас пройти наши бесплатные онлайн курсы программирования и вёрстки.

Понятия веб-сайт и веб-ресурс

Веб-сайт - совокупность файлов, документов, отраженных при помощи языка программирования таким образом, чтобы их видели пользователи сети Интернет. Другими словами, сайты включают в себя любую текстовую, графическую, аудио- или видеовизуальную информацию, собранную на странице или нескольких страницах.

Определяет уникальность того или иного веб-сайта, как правило, доменное имя. А веб-ресурс - это некий узел или точка, в который включен специальный идентификатор, позволяющий при необходимости с легкостью отыскать нужную страницу на просторах сети Интернет. Чаще всего один домен соответствует одному веб-ресурсу, однако иногда бывает так, что на одном домене располагаются несколько веб-ресурсов, или же один веб-ресурс имеет для себя несколько доменов.

Чем крупнее веб-сайт, тем большая вероятность, что он будет расположен на нескольких доменах. Один же домен, как правило, включает в себя несколько веб-сайтов, как правило, это возможно для бесплатных веб-хостингов.

Виды веб-ресурсов

Разные типы веб ресурсов

Существуют определенные различия веб-ресурсов по видам:

по доступности сервисов:

  • открытые – когда каждому без исключения пользователю сети Интернет доступны все сервисы
  • полуоткрытые – когда необходимо пройти регистрацию, как правило, бесплатно
  • закрытые – частные и личные сайты, созданные для организаций и компний, куда ппасть можно только обладая специальным приглашением.

по физическому расположению:

  • общедоступные - открыты всем пользователям
  • локальные – открыты только в зоне доступа локальной сети (специальной компьютерной сети на достаточно небольшой территории).
  • информационные ресурсы – включают в себя тематические сайты (с узко направленной тематикой) и тематические порталы (обычно достаточно большие веб-ресурсы с исчерпывающей информацией, а также возможностью пользователям общаться в рамках ресурса).
  • интернет-представительства – как правило, сайты тех, кто владеет бизнесом. Существуют разные подвиды таких сайтов: сайт-визитка, промо-сайт, интернет-магазин и др.
  • веб-сервисы – также включают в себя различные подвиды (блоговый, видеохостинг, поисковые сервисы и др.) и созданы для выполнения определенного ряда задач в сети Интернет.

Также можно выделить наиболее интересные виды веб-ресурсов по типу сайтов:
Сайт для рекламы. На таком сайте главную роль обычно играет «дизайн» как способ улучшить внешний вид чего-либо или более успешно визуализировать (в таком случае можно говорить о «дизайне» как виде деятельности).

Сайт для бизнеса. В таком случае веб-ресурс не будет являться слишком объемным по содержанию, т.к. основная цель таких сайтов – закрепление будто на витрине самой важной информации, необходимой потенциальному заказчику или потребителю. Однако, стоит также отметить, что существуют внутрифирменные веб-ресурсы (корпоративные – где учитываются маркетинговая политика компании, все интересующие вопросы заказчиков и клиентов).

Хранение веб-сайтов

Для того чтобы тот или иной сайт нормально функционировал, он обязательно должен быть сохранен в надежном месте. Для таких целей существуют специальные сервера. По-другому их называют аппаратными серверами, или веб-серверами. Также существует специальное название услуг, которые предоставляются для сохранения сайтов. Их называют веб-хостингом.

Примечательно, что ранее для того чтобы сохранить сайт, необходим был какой-то один определенный сервер. Сейчас же сеть Интернет развивается настолько молниеносно, что зачастую пользователи прибегают к варианту, когда несколько сайтов могут храниться на одном сайте в рамках т.н. виртуального хостинга.

Не исключен и иной вариант, когда один и тот же сайт храниться по разным адресам и серверам. При этом существует оригинал и копия (как ее по-другому называют, - зеркальная версия сайта)

Стоит отметить, что для веб-разработчиков такой порядок вещей является вполне приемлимым и лучшим решением. Ведь в таком случае не стоит создавать определенный сервис для хранения данных определенного сайта, а пользоваться уже хорошо обработанным сервером для хранения всех данных в целом.

Также стоит отметить немаловажную роль администраторов или т.н. сисадминов (на языке сленга), которые играют немаловажную роль в формировании успешно функционирующего веб-ресурса, следящие за его наполнением и устойчивыми параметрами.

Современное развитие сети Интернет так или иначе принуждает нас быть в курсе тех вещей, с которыми мы сталкиваемся в этой самой сети. В случае, если вы решили начать вести свой блог, открыть интернет-магазин, или просто "в теме" того, с чем имеете дело, входя в сеть, очень важно знать, что такое веб-ресурс.

«Ройся в книгах при всяком удобном случае. Старайся перелистать и пересмотреть на своем веку возможно больше разных книг».
Н. А. Рубакин (русский книговед и писатель)
Книга — главный источник знаний: подсчитано, что 85% своих знаний мы получаем из книг. А. И. Герцен размышлял: «Вся жизнь человечества последовательно оседала в книге: племена, люди, государства исчезали, а книга оставалась. Она росла вместе с человечеством, в нес кристаллизовались все учения, потрясавшие и вес умы, страсти, потрясавшие сердца; в нес записана та огромная исповедь бурной жизни человечества, та огромная аутография, которая называется всемирной историей. Но в книге не одно прошедшее; она составляет документ, по которому мы вводимся во владение настоящего, во владения всей суммы истин и усилий, найденных страданиями, облитых иногда кровавым потом; она программа будущего».


Для того чтобы найти нужную книгу, необходимо знать основы библиографии — науки, задачей которой является учет печатной продукции и информация о ней. Основные виды каталогов (перечень имеющейся литературы) в библиотеке: алфавитные и систематические.
Все алфавитные каталоги организованы по единому принципу. Описание произведений печати располагаются в алфавите заголовков и заглавий, они включают фамилию автора или авторов, редакторов, название произведения, выходные данные.
В систематическом каталоге описания литературы расположены по отраслям знаний. темам, вопросам.

Основные виды литературы

Учебники — книги, содержащие систематическое изложение знаний, которые обязательно должны быть усвоены в рамках определенной учебной дисциплины. Они могут быть авторским, т. с. написанным одним или несколькими авторами, или коллективными, когда в его создании принимал участие целый коллектив авторов.
Учебники бывают:
- универсальные — содержат систематический текст, представляющий с помощью слов и графических изображений данную область, наряду с этим даются проблемы для решения, исследовательские идеи, упражнения и практические задания;
- систематические — включают упорядоченные знания, соответствующие годовой программе по какому-либо предмету.
Курс лекций — учебное издание, в котором опубликован авторский лекционный курс по какой-либо учебной дисциплине.
Учебное пособие — в них рассматривается часть учебного курса, имеет практическую сторону усвоения учебного материала, содержит больше практических рекомендаций. К учебным пособиям также относятся учебные словари и справочники, своды данных, таблицы и т. д.
Сборник упражнений и практических заданий — он может иметь компактный характер, например книги с грамматическими и орфографическими упражнениями; сборник математических, физических, химических задач; сборники педагогических ситуаций и т. д.
Методическое пособие — это издание, содержащее практические рекомендации по какому-либо вопросу.
Монография — научное или научно-популярное книжное издание, содержащее пол-нос и всестороннее исследование одной проблемы или темы.
Сборник научных трудов (статей) - статьи и другие материалы научного характера, принадлежащие разным авторам, как правило, посвященные одной проблеме.
Программированный учебник — текст построен в соответствии с принципами программированного обучения. Особенность состоит в том, что, помимо информационного материала, содержится система контрольных вопросов и заданий, обеспечивающих возможность самостоятельного приобретения знаний и необходимых умений, а также возможность управления познавательной деятельностью обучающегося в процессе усвоения.
Электронная версия научной, художественной, публицистической литературы.
Электронный учебник — это программно-методический комплекс, обеспечивающий возможность самостоятельного или при участии преподавателя, освоения учебного курса или его большого раздела именно с помощью компьютера. Электронный учебник или курс обычно содержит три компонента: презентационную составляющую, в которой излагается основная информационная часть курса; упражнения, способствующие закреплению полученных знаний; тесты, позволяющие проводить объективную оценку знаний учащегося.
Особенности электронных учебников:
• обеспечивает практически мгновенную обратную связь (свойство интсрактивности);
• компьютерная визуализация учебной информации и звуковое сопровождение;
• помогает быстро найти необходимую информацию, поиск которой в обычном учебнике затруднен (повышение производительности поиска);
• существенно экономит время при многократных обращениях к гипертекстовым объяснениям;
• автоматизация процессов вычислительной, информационно-поисковой деятельности, а также обработки результатов учебного эксперимента с возможностью многократного повторения фрагмента или самого эксперимента;
• автоматизация процессов информационно-методического обеспечения, организационного управления учебной деятельностью и контроля за результатами усвоения;
• не просто выводит текст на экран, но и рассказывает, показывает, моделирует и т. д. — именно здесь проявляются возможности и преимущества мультимедийных технологий (принцип наглядности и доступности);
• позволяет быстро найти наиболее подходящее для конкретного индивидуума задание, проверить знания по определенному разделу (настройка на конкретного обучаемого);
• может обновить необходимую учебную информацию, например, с помощью интернета (принцип актуализации информации);
• соответствующая информационная часть, учитывает психологию восприятия читающего.
Хрестоматия — сборник систематически подобранных в учебных целях или для самообразования материалов по какой-либо отрасли знания.
Научный журнал — периодическое издание, содержащее статьи научного характера и имеющее постоянные рубрики.
Справочно-информационная литература: энциклопедии (систематизированный свод знаний), энциклопедический словарь (универсальные и отраслевые), справочник (краткие сведения научного и прикладного характера), терминологический словарь (разъяснение значения специальных слов), толковый словарь (значение, особенности употребления и звучания слов, их грамматические характеристики).

Основными формами работы с книгой являются:

Основные приемы скорочтения (при многократных, систематических упражнениях):
1. Не произносить про себя читаемые слова.
2. Не переводить взгляд вдоль строки и с одной строки на другую, а охватывать взглядом как можно большую часть страницы.
3. Читая текст, сосредоточивать внимание на самом главном его содержании.
4. Читать не по горизонтали, а по вертикали.
5. Расширение словарного запаса.
6. Умение выделять ключевые слова, мысли и идеи.
7. Постановка вопросов и беглый просмотр текста.
Виды чтения:
• предварительное — общее знакомство с книгой, выделение существенного, что требует тщательного изучения;
• сквозное (сплошное) — охват содержания книги в целом;
• выборочное — поиск нужного ответа на возникший вопрос;
• повторное — проникновение в суть проблемы;
• чтение с проработкой материала — критический анализ прочитываемой книги, конспектирование;
• партитурное — быстрое, динамичное, беглое ознакомление с книгой в целом, при большой скорости чтения;
• смешанное — применение разных видов чтения в каждом конкретном случае.
Памятка по работе с первоисточниками:
1. Обратить внимание на время, историю и цель создания произведения.
2. Прочитать текст произведения или отрывки из него.
3. Определить непонятные слова, найти их значение в справочно-информационных изданиях
2. Разбить текст на смысловые части.
3. Выделить основные положения произведения, его главные идеи.
4. Сделать выводы.
5. Записать в тетрадь необходимые положения.
Памятка по работе с научной книгой:

1. Знакомство с книгой необходимо начинать с заглавия. Оно в научной литературе всегда указывает тему. Книга научно-популярная чаще предпочитает заголовок яркий, образный.
2. Прочитать аннотацию — эта сжатая характеристика содержания с указанием возможного круга читателей книги, она находится на обороте титульного листа или на последней странице издания или на его обложке.
3. Внимательно изучить оглавление, ведь это план изложения темы, своеобразный путеводитель.
4. Просмотреть предисловие или авторское введение. В нем изложены задачи, поставленные автором, содержится общий план изложения.
5. Познакомиться с заключением (послесловием) книги, в нем даны краткие выводы по материалам издания.
6. Знакомство с предметным или алфавитным указателем книги поможет в поиске информации по нужному вопросу.
7. После такого знакомства с книгой определить разделы, которые следует изучить подробнее.
8. Читая книгу или нужный раздел книги, делать пометки и выписки:
• уметь выделить в материале (пометки на полях карандашом, если книга личная или
на закладках) главное, существенное, которое следует запомнить, или спорное, над чем стоит
подумать, пользуясь при этом специальными значками «?», «!», «+» и т. п.;
• оформлять в тетради или на карточке выписки существенного, выводов, фактического материала: годы событий, имена, цифры; не забывать при этом, указать автора и название источника, место и год издательства, страницу, на которой расположен выписанный материал;
• для более прочного усвоения прочитанного составлять план, тезисы, конспекты.
9. Встретив непонятное слово, обратиться к словарю, справочнику, что это слово значит, где оно употребляется.
10. По окончании чтения книги надо дать себе отчет в том, что дала нового эта книга, — если дала, чего не дала, что еще надо узнать по тому же предмету, в чем читающий согласен или не согласен с автором и почему. Конечно, вначале такой способ чтения покажется медлительным и трудным, но уже четыре — пять книг, прочитанных таким образом, дадут навык к серьезному и сознательному чтению.

Памятка по работе с Интернет-ресурсами:

Интернет-ресурсы используются в учебно-научной работе наравне с традиционными печатными изданиями.
1. Необходимо использовать только надежные источники информации (сайты официальных организаций, научно-образовательные порталы и сайты, базы данных научной периодики и книг, СМИ и др.).
2. Ссылки составляют как на электронные ресурсы в целом (электронные документы, базы данных, порталы, сайты и т. д.), так и на составные части электронных ресурсов (разделы и части электронных документов, порталов, сайтов, публикации в электронных сериальных изданиях и т. п.).
3. Ссылка дастся на конкретную веб-страницу, с которой взят материал, а не на главную страницу сайта.
4. При использовании ресурсов внимательно изучите дату размещения материала, чтобы избежать цитирования устаревших данных.
5. Для электронных ресурсов удаленного доступа приводят примечание о режиме доступа, в котором допускается вместо слов «Режим доступа» (или их эквивалента на другом языке) использовать для обозначения электронного адреса аббревиатуру «URL» (Uniform Resource Locator — унифицированный указатель ресурса).
6. Дата обращения к документу — та дата, когда человек, составляющий ссылку, данный документ открывал, и этот документ был доступен. Дата обращения указывается обязательно, се приводят в круглых скобках, указывая число, месяц и год.

Пример оформления электронного ресурса:

Крысанова О. А. Методология психолого-педагогических исследований.

Задания для самостоятельной работы

1. Определить скорость чтения (количество слов в минуту).
2. Составить аннотацию по прочитанной психолого-педагогической книге.
3. Составить памятки по работе над докладом, рефератом, конспектом.
Библиографический список
1. Андреев О. А., Хромов П. Н. Техника быстрого чтения. — Мн., 2002.
2. Гецов Г. Как читать книги, журналы, газеты. — М.: Знание, 1989. — 144 с.
3. ГраникГ. Г., Бондарснко С. М., Концевая Л. А. Как учить работать с книгой. —М.: Мой учебник, 2007. — 256 с.
4. Учись быть читателем (навыки самостоятельной работы с книгой) /Сост. В. В. Дергилева. —Волгоград, 2007. — 38 с.
Источник: Касимова, 3. Адаптация студентов к обучению в вузе [Электронный ресурс] : учебное пособие /
3. Ш. Касимова. — Электрон, дан. и прогр. (6 Мб). — Саратов: Ай Пи Эр Медиа, 2018. —64 с.

Использование «мусорных» источников способно убить курсовую работу и перечеркнуть все твои старания. Не важно, сколько у тебя процентов в антиплагиате, если курсовая написана с опорой на низкосортные интернет-источники.

Рассмотрим конкретный пример. Ты ищешь информацию по запросу «сущность правового государства» — из прошлого урока мы выяснили, что это идеальное название для пункта 1.1 курсовой.



Ни один из результатов запроса в поисковой выдаче нельзя использовать как источник для написания параграфа :

Этот источник — неавторитетный . Не ясно, кто автор текста, грамотно оформить цитирование будет сложно. Лучше найти первоисточник и работать с ним.

Это даже не источник, а обычная реклама . Ссылка на такой сайт может натолкнуть преподавателя на мысль, что курсовую ты писал не сам.

Все ответы на этом ресурсе написаны простыми пользователями , часто — школьниками. Не самая надёжная информация, использовать её не стоит.

На сайте указан первоисточник размещённой информации, но это книга за 2004 год . Стоит поискать что-то посвежее.

Википедия — отдельная история. Википедию можно почитать на досуге, но в научной работе такая ссылка — дурной тон . Об этом мы ещё поговорим.

Используя низкосортные ресурсы в качестве источников, ты рискуешь свести на нет все свои усилия.

Чем опасны низкосортные источники


У тебя мог возникнуть резонный вопрос: «Что не так с этими интернет-источниками? Почему это так важно?». Рассказываем, чем опасны мусорные источники:

  • Информация может быть неверной. Тексты для сайтов часто пишут копирайтеры без профильного образования. В лучшем случае можно наткнуться на перефразированную научную статью. В худшем — это будет рерайт другой подобной статьи. Достоверность информации в таком случае искажается как в игре «испорченный телефон».
  • Информация может быть неактуальной. Обычно дату публикации статьи на сайте определить просто невозможно. Добавь к этому возможность использования автором «древней» статьи в качестве источника и получишь абсолютно неактуальную информацию.
  • Отсутствует теоретическая глубина. Даже если ты нашёл образовательный или научно-популярный ресурс с достоверной информацией, там ты не увидишь глубоких научных исследований. Научпоп-статьи слишком поверхностные — в них часто нет ничего кроме определений и парочки типологий. Всесторонне изучить тему не получится.

Использовать мусорные источники — это пустая трата времени

С мусорными источниками легко бороться. Есть пять признаков низкосортной информации — если нашёл совпадение хотя бы по одному из пунктов, то закрывай вкладку:

  • не указаны первоисточники представленной информации
  • невозможно определить авторов статьи
  • невозможно определить дату публикации статьи и возраст первоисточника
  • сайт является биржей для заказа курсовых
  • экспертность автора ничем не подтверждается

Но, не каждый интернет-источник — мусорный . Поговорим о том, какие источники использовать можно.

Как выбрать интернет-источники


Далеко не все интернет-источники плохие. Многие из них не только можно, но и нужно использовать. Некоторые темы невозможно раскрыть, изучая только статьи из научных журналов и учебники.

  • материалы информационных агентств
  • материалы авторитетных СМИ
  • материалы профильных авторитетных интернет-ресурсов
  • материалы, размещённые на официальных сайтах компаний
  • материалы Росстата, сайтов государственных органов, налоговых и правовых баз


Чтобы закрепить теорию на практике потренируемся выбирать интернет-источники.

Почему нельзя использовать Википедию

Википедия не гарантирует истинность

Мы ничего не имеем против Википедии — её можно читать для беглого знакомства с темой исследования. Но ссылаться на этот ресурс в научной работе нельзя.

Википедия обладает свойствами мусорного источника:

  • Автором статьи на Википедии может быть кто угодно. Автор может случайно допустить ошибку, или неверно перевести иностранную статью и написать бред. Может быть, автор — адепт течения «Плоская Земля» и распространяет лженаучные факты. Определить качество научной информации, когда ты ещё не специалист — сложно.
  • Информация может быть устаревшей. Если тема непопулярная или очень узкая, то статья может не обновляться годами. Твоя цель — искать максимально актуальные и свежие данные.
  • Информация на «Википедии» поверхностная. Статьи на «Википедии» не отличаются глубиной. Ничего, кроме определения и краткой исторической справки, ты там не найдёшь.

Важно помнить: Интернет-источники, перечисленные выше, не должны составлять более 30% твоего списка литературы.

Читайте также: