<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Электронный научно-практический журнал «Современные научные исследования и инновации» &#187; data analasys</title>
	<atom:link href="http://web.snauka.ru/issues/tag/data-analasys/feed" rel="self" type="application/rss+xml" />
	<link>https://web.snauka.ru</link>
	<description></description>
	<lastBuildDate>Sat, 18 Apr 2026 09:41:14 +0000</lastBuildDate>
	<language>ru</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>Разработка алгоритма поиска информации или информационного объекта в тексте</title>
		<link>https://web.snauka.ru/issues/2016/06/69146</link>
		<comments>https://web.snauka.ru/issues/2016/06/69146#comments</comments>
		<pubDate>Wed, 22 Jun 2016 12:06:10 +0000</pubDate>
		<dc:creator>Рябов Артем Вадимович</dc:creator>
				<category><![CDATA[05.00.00 ТЕХНИЧЕСКИЕ НАУКИ]]></category>
		<category><![CDATA[data analasys]]></category>
		<category><![CDATA[marketing research]]></category>
		<category><![CDATA[text documents]]></category>
		<category><![CDATA[анализ данных]]></category>
		<category><![CDATA[маркетинговые исследования]]></category>
		<category><![CDATA[текстовые документы]]></category>

		<guid isPermaLink="false">https://web.snauka.ru/issues/2016/06/69146</guid>
		<description><![CDATA[Научный руководитель: Аполлонова И.А,. к.т.н, заместитель заведующего кафедрой «Медико-технический менеджмент» Ранее были исследованы и выделены основные препятствия при проведении анализа баз данных с помощью программных средств, поставляемых совместно со стандартным офисным пакетом [1]. Ниже представлены основные из них: – ошибки в наименовании изделия или указание наименования в транскрипции; – представление в одном лоте сразу несколько [...]]]></description>
			<content:encoded><![CDATA[<p style="text-align: center;"><em>Научный руководитель: Аполлонова И.А,. к.т.н,</em></p>
<p style="text-align: center;"><span><em>заместитель заведующего кафедрой «Медико-технический менеджмент»<br />
</em></span></p>
<p style="text-align: justify;"><span>Ранее были исследованы и выделены основные препятствия при проведении анализа баз данных с помощью программных средств, поставляемых совместно со стандартным офисным пакетом [1]. Ниже представлены основные из них:<br />
</span></p>
<p style="text-align: justify;"><span>– ошибки в наименовании изделия или указание наименования в транскрипции;<br />
</span></p>
<p style="text-align: justify;"><span>– представление в одном лоте сразу несколько видов медицинских изделий;<br />
</span></p>
<p style="text-align: justify;"><span>– общее наименование изделий без указания производителя или модели.<br />
</span></p>
<p style="text-align: justify;"><span>Исходя из этого к разрабатываемому алгоритму были представлены следующие требования:<br />
</span></p>
<p style="text-align: justify;"><span>– определение по базам данных объема закупленного «наименования» товара, с учетом различных вариантов указания «наименования» в лоте;<br />
</span></p>
<p style="text-align: justify;"><span>– определение средней стоимости «наименования» товара, с учетом расположения нескольких изделий в одном лоте;<br />
</span></p>
<p style="text-align: justify;"><span>– конкретизация типа изделия по косвенным характеристикам, указанным в лоте.<br />
</span></p>
<p style="text-align: justify;"><span>Переходя к обзору алгоритма, следует заметить, что его использование для определения показателей, характеризующих рынок определенного изделия, не является полностью автоматическим и требует от пользователя знания по крайней мере основных игроков сегмента и базовых знаний о разновидностях входящих в него изделий.<br />
</span></p>
<p style="text-align: justify;"><span>На рисунке 1 представлена блок – схема работы алгоритма.</span></p>
<p style="text-align: center;"><img src="https://web.snauka.ru/wp-content/uploads/2016/06/062216_1202_1.png" alt="" /></p>
<p style="text-align: center;">Рис. 1. Блок – схема работы алгоритма.</p>
<p style="text-align: justify;"><span>На этапе ввода информации алгоритм обрабатывает поле базы данных, в котором указывают <span style="color: black;">наименование товара, работ, услуг. Задача локального алгоритма сводится к нахождению всех наименований товаров в разных формах его написания.<br />
</span></span></p>
<p style="text-align: justify;"><span style="color: black;">Для выявления наименований предложено использовать разные алгоритмы под разные условия поиска: в условиях, когда сегмент представлен в основном изделиями зарубежного производства, используется алгоритм поиска латинских символов. Причем для того, что бы избежать попадания в одну переменную сразу нескольких наименования, было допущено, что наименования между собой имеют кириллицу или знаки пунктуации. Шаги локального алгоритма представлен ниже:<br />
</span></p>
<p><span style="text-align: justify;">1) Ввод данных &#8211; строка лота из поля «наименование товаров работ и услуг»:</span></p>
<p><span style="color: black;">«Духкамерный кардиовертер-дефибриллятор имплантируемый Lumax 340DR-T в комплекте с электродами Linox S65, Selox SR53 и двумя интродьюсерами»<br />
</span></p>
<p><span style="text-align: justify;">2) Преобразование строки:</span></p>
<p><span style="color: black;">«**** ****-**** **** Lumax 340 DR-T * **** * **** Linox S65* Selox SR53 * **** ****»<br />
</span></p>
<p><span style="text-align: justify;">3) Разбиение строки по разделителю и загрузка в список:</span></p>
<p><span>['<span style="color: black;">Lumax 340 DR-T</span>', '<span style="color: black;">Linox S65</span>', '<span style="color: black;">Selox SR53</span>']<br />
</span></p>
<p><span style="text-align: justify;">4) Передача каждого элемента списка в переменную имени (наименования изделия).</span></p>
<p style="text-align: justify;"><span>На этапе вывода вариантов наименований изделий, пользователю необходимо определить, что из списка представленных наименований будет относится к исследуемому сегменту рынка, а также соотнести различные написание наименования изделия с единственно правильным.<br />
</span></p>
<p style="text-align: justify;"><span>Этап определения атрибутов является самым длительным из остальных, так как требует большого количества итераций по строкам лота, которое увеличивается соответственно объему базы данных.<br />
</span></p>
<p style="text-align: justify;"><span>Идея локального алгоритма заключается в нахождении пересечений множеств списков, элементами которых являются отдельные слова в строках лотов. Лоты выбираются из условия, что они содержат общее для них наименование изделия. Информация, которая чаще всего встречается в лотах (кроме названия изделия), будет являться общим пересечением множеств списков. Такая информация используется как атрибут изделия. Шаги работы локального алгоритма представлен ниже.<br />
</span></p>
<div style="text-align: justify;">1) Итерация по строка поля <span>«наименование товаров работ и услуг»: </span></div>
<p style="text-align: justify; margin-left: 18pt;"><span>а) «</span>Имплантируемый кардиовертер-дефибриллятор MAXIMO II CRT-D для ресинхронизирующей терапии с принадлежностями (арт. D284TRK)»</p>
<p style="text-align: justify; margin-left: 18pt;">б) «Имплантируемый кардиовертер-дефибриллятор для ресинхронизирующей терапии Maximo II CRT-D»</p>
<p style="text-align: justify; margin-left: 18pt;">в) «Имплантируемый кардиовертер-дефибриллятор Maximo II CRT-D. (Цифровой имплантируемый кардиовертер-дефибриллятор для ресинхронизирующей терапии с системой удаленного мониторинга пациента в комплекте с электродами и интродъюссерами)»</p>
<p><span style="text-align: justify;">2) Нахождение пересечения множеств и выбор пользователем необходимого и достаточного варианта пересечения для определения модели изделия по его атрибутам: «Имплантируемый кардиовертер-дефибриллятор MAXIMO II CRT-D»</span></p>
<p style="text-align: justify;"><span>Имея все варианты написания наименования изделия, а также его атрибуты, можно переходить к конкретизации типа изделия по косвенным характеристикам, указанным в лоте.<br />
</span></p>
<p style="text-align: justify;"><span>Последний этап заключается в итерации по всем лотам, при совпадении атрибутов и наименования изделия, алгоритм добавляет информацию, как показано на рисунке 2.</span></p>
<p style="text-align: center;"><img src="https://web.snauka.ru/wp-content/uploads/2016/06/062216_1202_2.png" alt="" /></p>
<p style="text-align: center;">Рис.2. Пример преобразованной базы данных</p>
<p style="text-align: justify;"><span>Метод определения средней стоимости товара заключается в нахождении распределения цен и отсечении ценовых значений, величина которых превосходит допустимый интервал.<br />
</span></p>
<p style="text-align: justify;"><span>Таким образом были разработаны алгоритмы и решены поставленные задачи по нахождению необходимой информации.</span></p>
]]></content:encoded>
			<wfw:commentRss>https://web.snauka.ru/issues/2016/06/69146/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
