<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Электронный научно-практический журнал «Современные научные исследования и инновации» &#187; database technology</title>
	<atom:link href="http://web.snauka.ru/issues/tag/database-technology/feed" rel="self" type="application/rss+xml" />
	<link>https://web.snauka.ru</link>
	<description></description>
	<lastBuildDate>Sat, 18 Apr 2026 09:41:14 +0000</lastBuildDate>
	<language>ru</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>«Большие Данные» &#8211; необходимость использования накопленных знаний и проблемы реализации данной технологии</title>
		<link>https://web.snauka.ru/issues/2016/07/70079</link>
		<comments>https://web.snauka.ru/issues/2016/07/70079#comments</comments>
		<pubDate>Wed, 13 Jul 2016 12:17:06 +0000</pubDate>
		<dc:creator>Коваленко Ольга Павловна</dc:creator>
				<category><![CDATA[05.00.00 ТЕХНИЧЕСКИЕ НАУКИ]]></category>
		<category><![CDATA[a single network]]></category>
		<category><![CDATA[business information]]></category>
		<category><![CDATA[data analysis method]]></category>
		<category><![CDATA[data flow]]></category>
		<category><![CDATA[database technology]]></category>
		<category><![CDATA[statistics]]></category>
		<category><![CDATA[the ETL procedure]]></category>
		<category><![CDATA[«Big Data » (BIG DATA)]]></category>
		<category><![CDATA[базы данных]]></category>
		<category><![CDATA[бизнес-информация]]></category>
		<category><![CDATA[единая сеть]]></category>
		<category><![CDATA[метод анализа данных]]></category>
		<category><![CDATA[поток данных]]></category>
		<category><![CDATA[процедура ETL]]></category>
		<category><![CDATA[статистические данные]]></category>
		<category><![CDATA[технология «Большие Данные» (BIG DATA)]]></category>

		<guid isPermaLink="false">https://web.snauka.ru/issues/2016/07/70079</guid>
		<description><![CDATA[Вступление. Активное развитие информационных технологий началось с появлением  ЭВМ. С 80-х годов прошлого столетья пошло массовое  внедрение и распространение персональных компьютеров, что в значительной мере увеличило скорость и объемы перерабатываемой  информации. Начиная  с этого времени начался сбор информации, обработка и хранение данных. По данным исследования  IDC Digital Universe , опубликованного в 2012 году, в ближайшие 8 лет [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: left;" align="center"><strong>Вступление</strong>. Активное развитие информационных технологий началось с появлением  ЭВМ. С 80-х годов прошлого столетья пошло массовое  внедрение и распространение персональных компьютеров, что в значительной мере увеличило скорость и объемы перерабатываемой  информации. Начиная  с этого времени начался сбор информации, обработка и хранение данных. По данным исследования  <a href="http://www.emc.com/collateral/analyst-reports/idc-digital-universe-united-states.pdf">IDC Digital Universe</a> , опубликованного в 2012 году, в ближайшие 8 лет количество данных в мире достигнет 40 Зб (zettabytes)  что эквивалентно 5200 Гб на каждого жителя планеты. В информационных технологиях появился термин- «Большие Данные» (BIG DATA), который  был впервые предложен Клиффордом Линчем, редактором журнала Nature, подготовившем 3 сентября 2008 года специальный номер журнала с темой «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объёмами данных?»</p>
<p><strong>Основной текст.</strong> Социальные сети, бизнес-информация, непрерывно поступающие данные с измерительных устройств, события от <a title="RFID" href="https://ru.wikipedia.org/wiki/RFID">радиочастотных идентификаторов</a>, <a title="Метеорология" href="https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D1%82%D0%B5%D0%BE%D1%80%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%8F">метеорологические данные</a>, данные <a title="Дистанционное зондирование Земли" href="https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D1%81%D1%82%D0%B0%D0%BD%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D0%BE%D0%B5_%D0%B7%D0%BE%D0%BD%D0%B4%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%97%D0%B5%D0%BC%D0%BB%D0%B8">дистанционного зондирования Земли</a>, потоки данных о местонахождении абонентов <a title="Сотовая связь" href="https://ru.wikipedia.org/wiki/%D0%A1%D0%BE%D1%82%D0%BE%D0%B2%D0%B0%D1%8F_%D1%81%D0%B2%D1%8F%D0%B7%D1%8C">сетей сотовой связи</a>, устройств <a title="Аудиорегистратор" href="https://ru.wikipedia.org/wiki/%D0%90%D1%83%D0%B4%D0%B8%D0%BE%D1%80%D0%B5%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%82%D0%BE%D1%80">аудио-</a> и <a title="Видеорегистратор" href="https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%B4%D0%B5%D0%BE%D1%80%D0%B5%D0%B3%D0%B8%D1%81%D1%82%D1%80%D0%B0%D1%82%D0%BE%D1%80">видеорегистрации</a>.  – это еще не все  виды источников, способных генерировать гигантские объемы информации.</p>
<p>Не многие знают, что огромную часть информации создает  не деятельность людей,  а роботы, которые взаимодействуют как друг с другом, так и с другими сетями данных, например, сенсоры и интеллектуальные устройства. При сегодняшних  темпах роста количество данных в мире, по прогнозам исследователей, будет ежегодно удваиваться. Количество виртуальных и физических серверов в мире вырастет в десятки раз за счет расширения и создания новых data-центров. Таким образом становится очевидным, что необходимо  эффективно использовать  накопленные данные, а так же применять  результаты анализа в бизнесе и прогнозировании будущих событий на основе исследований баз данных  предыдущих лет.</p>
<p>Говоря о «Больших Данных»  используют наиболее популярное определение трех «V»:</p>
<p>Volume – объем данных,</p>
<p>Velocity – необходимость обрабатывать информацию с большой скоростью,</p>
<p>Variety – многообразие и часто недостаточную структурированность данных.</p>
<p>Ежедневно накапливается, сохраняется и обновляется неисчислимое количество данных во всем мире.  Это информация в совершенно разных форматах: это и цифры статистики, редактируемые документы, сканы, опросы, страницы в соцсетях, видеозаписи, машинные коды и тому подобное. Места хранения этой информации также разнообразны- от локальных дисков и удаленных серверов до виртуальных хранилищ информации. Собрать, обработать и структурировать подобную информацию практически невозможно. Поэтому нужны более четкие и структурированные требования к параметрам анализа. Еще одной особенностью работы с большими объемами информации, а именно с базами данных является то, что это непрекращающийся поток данных, бесконечное количество раз обновляющихся в непрерывном потоке времени. Этими особенностями  и осложнено использование технологии BIG DATA «Большие Данные».</p>
<p>Большой объем и высокая скорость потока данных, процесс их сбора предполагает процедуры ETL в режиме реального времени.<em> ETL</em> <em>– от</em> <em>англ. Extract,</em> <em>Transform,Load — дословно «извлечение, преобразование, загрузка») — один из основных процессов в управлении</em> <em>хранилищами данных, который включает в себя: извлечение данных из внешних источников, их трансформацию и</em> <em>очистку с целью соответствия нуждам</em> <em>бизнес-модели и загрузка их в хранилище данных.</em>  ETL используется не только как процесс переноса данных из одного приложения в другое, а также является  инструментом для  подготовки данных к анализу.</p>
<p>Используя анализ больших данных возможно решить одну из задач современного общества- создать единую сеть, единую базу с различными уровнями доступа. Подключив необходимые сервисы, банки и услуги можно упростить работу многих организаций. Например, внеся однажды паспортные данные гражданина автоматически их подгружать при составлении различных документов, отображая их в необходимом виде.</p>
<p>При работе с большими объемами данных немаловажную роль играет  вопрос обеспечения их безопасности. Данные поступают из разных источников и должны иметь различные решения по обеспечению безопасности, соответствующие объемам и статусу собираемой информации. Отдельный статус безопасности должна иметь система доступа к базам уже переработанных данных. Но методы анализа «Больших Данных» развиваются медленнее роста самих баз данных, важную роль играют аналитические платформы и их свойства для обработки, анализа и преобразования данных.</p>
<p>Сейчас довольно широко используются новейшие технологии и разработки на базе баз данных, но все это локально, либо узконаправленно. Например, есть мобильные приложения для дисконтных карт, привязанных к номеру мобильного телефона, что значительно упрощает и уменьшает скорость обслуживания в магазинах. Базы вакансий и соискателей, как трансформеры собираются и преобразовываются  в режиме on-line на разных информационных ресурсах с различными оболочками, но не в едином виде и с многообразной  ценовой политикой доступа на эти сайты. В то время, как резюме является одной из максимально –полных анкетных данных трудоспособного человека. Эти персональные данные практически не защищены от злоумышленников и достаточно разрозненны.  Обработка и анализ персональных данных имеет тонкую грань,  которая  граничит с невмешательством  в частную жизнь (Федеральный закон от 27 июля 2006 г. N 152-ФЗ О персональных данных).</p>
<p>Наряду с использованием информации переработанных баз данных в коммерческих целях возможно и её использование в государственных структурах, например, в правоохранительных органах. Применение поиска и опознания людей с помощью систем видеонаблюдения на дорогах. Использование данных переписи населения и задействование граждан через социальные службы в государственных программах.</p>
<p>Немаловажной проблемой сбора и переработки данных являются специалисты, а вернее их дефицит. Как и любая развивающаяся сфера деятельности человека в начале пути имеет проблемы с наличием специалистов нужного профиля необходимой подготовки. Если брать во внимание отсутствие постановки четких задач и области применения технологии  «Большие Данные», то  вопрос подготовки нужных специалистов можно считать таким же размытым, как и проблемы реализации технологии BIG DATA.</p>
<p><strong>Заключения и выводы</strong>. На сегодняшний день результатами анализа «Больших Данных» пользуются коммерческие организации по запросу. Как пример &#8211; при переработке статистических данных посещения сайтов определяется целевая группа, время наибольшей активности посетителей и часто посещаемые страницы, таким образом корректируется способ продвижения продукции. Накопление и анализ статистических данных по населению страны и планирование социальных мероприятий используются государственным аппаратом.</p>
<p>Ожидается, что развитие и  широкое  использования концепции   результатов анализа больших объемов информации  инициирует проникновение технологий «Больших Данных» как в научно-исследовательскую деятельность, так и в коммерческий сектор и сферу государственного управления.</p>
]]></content:encoded>
			<wfw:commentRss>https://web.snauka.ru/issues/2016/07/70079/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
