Эффективный анализ больших данных, извлеченных из наукометрической базы Scopus

Неретин, Артём Александрович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Данная работа описывает основные моменты разработки программного обеспечения для выгрузки и анализа данных из API Scopus, предоставляемое Elsevier. Представлены методы кластерного анализа для построения взаимосвязей на основе графов.

Введение …………………………………………………………………………………………………. 12
Глава 1. Теоретическая часть ………………………………………………………………… 13
1.1. Методика расчёта CiteScore………………………………………………………….. 13
1.2. Реляционная база данных PostgreSQL ………………………………………… 14
1.3. GET и POST запросы……………………………………………………………………. 15
1.4. Наукометрические базы данных………………………………………………….. 15
1.5. Выгрузка данных …………………………………………………………………………. 18
1.6. Кластерный анализ ………………………………………………………………………. 20
1.7. Облако тегов ………………………………………………………………………………… 21
Глава 2. Практическая часть…………………………………………………………………. 23
2.1. Разработка и реализация структуры базы данных ……………………… 23
2.2. Выгрузка данных с использованием автоматизированного скрипта
…………………………………………………………………………………………………………….. 24
2.3. Первичный количественный анализ …………………………………………… 26
2.4. Построение облака тегов ……………………………………………………………… 27
2.5. Выделение кластеров ученных ……………………………………………………. 28
2.6. Построение облака тегов имён авторов ………………………………………. 32
2.7. Анализ кластеров …………………………………………………………………………. 32
Глава 3. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение …………………………………………………………………………………. 34
3.1. Потенциальные потребители результатов исследования …………… 34
3.2. Анализ конкурентных технических решений с позиции
ресурсоэффективности и ресурсосбережения…………………………………….. 34
3.3. Диаграмма Исикава……………………………………………………………………… 36
3.4. SWOT-анализ ……………………………………………………………………………….. 37
3.5. Оценка готовности проекта к коммерциализации ……………………… 38
3.6. Методы коммерциализации результатов научно-технического
исследования. ……………………………………………………………………………………….. 40
3.5. Инициация проекта ……………………………………………………………………… 40
3.5.1 Цели и результат проекта. …………………………………………………………………………………………40
3.5.2 Организационная структура проекта. …………………………………………………………………….41
3.5.3 Ограничения и допущения проекта. ……………………………………………………………………….42
3.6. Планирование управления научно-техническим проектом ……….. 42
3.6.1. План проекта ……………………………………………………………………………………………………..42
3.6.3. Бюджет научного исследования ……………………………………………………………………………..46
3.6.4. Организационная структура проекта …………………………………………………………………….47
3.6.5. Расчёт электроэнергии ……………………………………………………………………………………………47
3.6.6. Накладные расходы ………………………………………………………………………………………………..47
3.6.7. Бюджет научного исследования ……………………………………………………………………………..48
3.6.8. Реестр рисков проекта …………………………………………………………………………………………….49

3.7. Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности
исследования ………………………………………………………………………………………. 50
3.7.1 Оценка сравнительной эффективности исследования ……………………………………..50

Глава 4. Социальная ответственность. …………………………………………………. 52
1. Социальная ответственность …………………………………………………………….. 52
4.1. Описание рабочего места……………………………………………………………… 52
4.2. Анализ выявленных вредных факторов проектируемой
производственной среды …………………………………………………………………….. 53
4.3. Микроклимат в помещении…………………………………………………………. 55
4.4. Освещенность ………………………………………………………………………………. 56
4.5. Электромагнитные поля………………………………………………………………. 60
4.6. Шум ………………………………………………………………………………………………. 61
4.7. Организация рабочего места оператора ПЭВМ ………………………….. 62
4.8. Анализ опасных производственных факторов ……………………………. 65
4.9. Электробезопасность ……………………………………………………………………. 65
4.10. Защита в чрезвычайных ситуациях …………………………………………… 68
4.11. Пожарная безопасность ……………………………………………………………… 69
4.12. Экологическая безопасность ……………………………………………………… 70
4.13. Научно техническая документация …………………………………………… 73
4.14. Выводы и рекомендации ………………………………………………………………. 74
Список литературы ……………………………………………………………………………….. 76
Приложение А. Пример данных о статье (XML формат) ……………………… 78
Приложение Б. Метод класса отправки запросов …………………………………. 79
Приложение В. Метод получения данных по номеру журнала …………….. 80
Приложение Г ………………………………………………………………………………………… 82
Приложение Д ………………………………………………………………………………………… 83
Приложение Е ………………………………………………………………………………………… 84

Теперь, как никогда ранее научное сообщество располагает огромным
количеством материала. Согласно некоторым исследованиям, объём
производства научных публикаций удваивается каждые девять лет [6].
Благодаря быстрому развитию информационно-коммуникационных
технологий (ИКТ), теперь можно получить доступ к большей части научной
литературы через интернет [7], что позволяет более эффективно передавать
знания. Однако этот процесс также ведёт к усилению конкуренции между
исследователями и увеличению требований к качеству материала. Эти
изменения побуждают исследователей, особенно тех, кто находится на ранних
этапах своей карьеры, сотрудничать с другими исследователями из своего или
другого учреждения. Динамичность такого партнёрства делает анализ сети
научного сотрудничества предметом большого интереса.
В основном для оценки автора используются индикаторы, полученные
через поисковые системы, такие как Google Scholar, Scopus и т.д., которые
включают количество и качество публикаций на основе журнальных и
авторских показателей. Тем не менее, эти критерии не учитывают взаимосвязь
между авторами. Хотя глобализация науки в современном мире обусловлена
сотрудничеством между исследователями и это стало большой проблемой
анализа эффективности работы конкретных авторов.
Данная работа направлена на определение структур сотрудничества
между исследователями в области «Экономики, Эконометрики и Финансов»
(ECON) и выявлении учреждений, направленных на данную тематику. В
качестве основного критерия используется сотрудничество в публикациях.
Доступ к данным осуществляется с помощью интерфейса Scopus Database API
[8].

Получена информация о 78354 статьях из области “Экономика, Эконометрика
и Финансы”, информация о 22712 авторах и их принадлежности к
университетам или научным организациям. Произведен первичный анализ
полученных данных. Все авторы были разбиты на кластеры, которые
основываются на взаимосвязи авторов через совместное написание работ.
Выявлена тенденция к неоднократному сотрудничества авторов,
занимающихся одной или смежными областями науки. Интерфейс реализован
на языке PHP, данные были выгружены в реляционную базу данных
PostgresSQL, анализ произведён при помощи языка R. Максимальное
количество соавторов для одной работы из статей, попавших в выборку,
равняется 39.

1)T.A. Brooks , Private acts and public objects: an investigation of citer
motivations, Journal of the American Society for Information Science 36(4) (1985)
223-229.
2)Bárbara S. Lancho-Barrantes, Vicente P. Guerrero-Bote, Félix Moya-
Anegón. What lies behind the averages and significance of citation indicators in
different disciplines? Article first published online: April 13, 2010. Volume: 36
issue: 3, page(s): 371-382.
3)Cristopher J. Date, Introduction to Database Systems, 2003.
4)Иванова Г.С. Основы программирования: Учебник для вузов. – М.:
Изд-во МГТУ им. Н.Э. Баумана, 2002. – 416 с.
5)Welling L., Thomson L. PHP and MySQL Web Development (4th
Edition). Addison-Wesley Professional, 2008 – 1008 p.
6)Noorden, R. V., 5 2014. Global scientific output doubles every nine
years.Mathematics&EconomicsNatureNewsBlog,
http://blogs.nature.com/news/2014/05/global-scientific-output-doubles-every-nine-
years.html.
7)Asadi, S., Dahlan, H. M., et al., 2017. Organizational research in the
field of green it: A systematic literature review from 2007 to 2016. Telematics and
Informatics.
8)Elsevier,2017.ScopusdatabaseAPIinterface.
https://dev.elsevier.com/ .
9)Uddin S., Hossain L., Rasmussen K. 2013. Network effect on scientific
collaborations. PloS One 8 (2), e57546
10) Schlattmann S., 2017. Capturing the collaboration intensity of research
institutions using social network analysis. Procedia Computer Science 106, 25–31.
11) Baghdadi, H. S., Ranaivo-Malan¸con, B., 2011. An automatic topic
identification algorithm. Journal of Computer Science 7 (9), 1363.
12) Can˜as-Guerrero, I., Mazarron, F., Pou-Merina, A., Calleja-Perucho,
C., Diaz Rubio, G., 2013. Bibliometric analysis of research activity in the
“agronomy” category from the web of science, 1997-2011. European Journal of
Agronomy 50 19–28.
13) Szymanski, B., De La Rosa, J., Krishnamoorthy, M., 2012. An internet
measure of the value of citations. Information Sciences 185 (1), 18–31.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Екатерина Б. кандидат наук, доцент
    5 (174 отзыва)
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподав... Читать все
    После окончания института работала экономистом в системе государственных финансов. С 1988 года на преподавательской работе. Защитила кандидатскую диссертацию. Преподавала учебные дисциплины: Бюджетная система Украины, Статистика.
    #Кандидатские #Магистерские
    300 Выполненных работ
    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Анна К. ТГПУ им.ЛН.Толстого 2010, ФИСиГН, выпускник
    4.6 (30 отзывов)
    Я научный сотрудник федерального музея. Подрабатываю написанием студенческих работ уже 7 лет. 3 года назад начала писать диссертации. Работала на фирмы, а так же помог... Читать все
    Я научный сотрудник федерального музея. Подрабатываю написанием студенческих работ уже 7 лет. 3 года назад начала писать диссертации. Работала на фирмы, а так же помогала студентам, вышедшим на меня по рекомендации.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Вирсавия А. медицинский 1981, стоматологический, преподаватель, канди...
    4.5 (9 отзывов)
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - ... Читать все
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - медицина, биология, антропология, биогидродинамика
    #Кандидатские #Магистерские
    12 Выполненных работ
    Мария А. кандидат наук
    4.7 (18 отзывов)
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет... Читать все
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет, реклама, журналистика, педагогика, право)
    #Кандидатские #Магистерские
    39 Выполненных работ
    Александр Р. ВоГТУ 2003, Экономический, преподаватель, кандидат наук
    4.5 (80 отзывов)
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфин... Читать все
    Специальность "Государственное и муниципальное управление" Кандидатскую диссертацию защитил в 2006 г. Дополнительное образование: Оценка стоимости (бизнеса) и госфинансы (Казначейство). Работаю в финансовой сфере более 10 лет. Банки,риски
    #Кандидатские #Магистерские
    123 Выполненных работы
    Екатерина Д.
    4.8 (37 отзывов)
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два об... Читать все
    Более 5 лет помогаю в написании работ от простых учебных заданий и магистерских диссертаций до реальных бизнес-планов и проектов для открытия своего дела. Имею два образования: экономист-менеджер и маркетолог. Буду рада помочь и Вам.
    #Кандидатские #Магистерские
    55 Выполненных работ
    Олег Н. Томский политехнический университет 2000, Инженерно-эконо...
    4.7 (96 отзывов)
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Явл... Читать все
    Здравствуйте! Опыт написания работ более 12 лет. За это время были успешно защищены более 2 500 написанных мною магистерских диссертаций, дипломов, курсовых работ. Являюсь действующим преподавателем одного из ВУЗов.
    #Кандидатские #Магистерские
    177 Выполненных работ
    Вики Р.
    5 (44 отзыва)
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написан... Читать все
    Наличие красного диплома УрГЮУ по специальности юрист. Опыт работы в профессии - сфера банкротства. Уровень выполняемых работ - до магистерских диссертаций. Написание письменных работ для меня в удовольствие.Всегда качественно.
    #Кандидатские #Магистерские
    60 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет