Эффективный анализ больших данных, извлеченных из наукометрической базы Scopus

Неретин, Артём Александрович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Данная работа описывает основные моменты разработки программного обеспечения для выгрузки и анализа данных из API Scopus, предоставляемое Elsevier. Представлены методы кластерного анализа для построения взаимосвязей на основе графов.

Введение …………………………………………………………………………………………………. 12
Глава 1. Теоретическая часть ………………………………………………………………… 13
1.1. Методика расчёта CiteScore………………………………………………………….. 13
1.2. Реляционная база данных PostgreSQL ………………………………………… 14
1.3. GET и POST запросы……………………………………………………………………. 15
1.4. Наукометрические базы данных………………………………………………….. 15
1.5. Выгрузка данных …………………………………………………………………………. 18
1.6. Кластерный анализ ………………………………………………………………………. 20
1.7. Облако тегов ………………………………………………………………………………… 21
Глава 2. Практическая часть…………………………………………………………………. 23
2.1. Разработка и реализация структуры базы данных ……………………… 23
2.2. Выгрузка данных с использованием автоматизированного скрипта
…………………………………………………………………………………………………………….. 24
2.3. Первичный количественный анализ …………………………………………… 26
2.4. Построение облака тегов ……………………………………………………………… 27
2.5. Выделение кластеров ученных ……………………………………………………. 28
2.6. Построение облака тегов имён авторов ………………………………………. 32
2.7. Анализ кластеров …………………………………………………………………………. 32
Глава 3. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение …………………………………………………………………………………. 34
3.1. Потенциальные потребители результатов исследования …………… 34
3.2. Анализ конкурентных технических решений с позиции
ресурсоэффективности и ресурсосбережения…………………………………….. 34
3.3. Диаграмма Исикава……………………………………………………………………… 36
3.4. SWOT-анализ ……………………………………………………………………………….. 37
3.5. Оценка готовности проекта к коммерциализации ……………………… 38
3.6. Методы коммерциализации результатов научно-технического
исследования. ……………………………………………………………………………………….. 40
3.5. Инициация проекта ……………………………………………………………………… 40
3.5.1 Цели и результат проекта. …………………………………………………………………………………………40
3.5.2 Организационная структура проекта. …………………………………………………………………….41
3.5.3 Ограничения и допущения проекта. ……………………………………………………………………….42
3.6. Планирование управления научно-техническим проектом ……….. 42
3.6.1. План проекта ……………………………………………………………………………………………………..42
3.6.3. Бюджет научного исследования ……………………………………………………………………………..46
3.6.4. Организационная структура проекта …………………………………………………………………….47
3.6.5. Расчёт электроэнергии ……………………………………………………………………………………………47
3.6.6. Накладные расходы ………………………………………………………………………………………………..47
3.6.7. Бюджет научного исследования ……………………………………………………………………………..48
3.6.8. Реестр рисков проекта …………………………………………………………………………………………….49

3.7. Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности
исследования ………………………………………………………………………………………. 50
3.7.1 Оценка сравнительной эффективности исследования ……………………………………..50

Глава 4. Социальная ответственность. …………………………………………………. 52
1. Социальная ответственность …………………………………………………………….. 52
4.1. Описание рабочего места……………………………………………………………… 52
4.2. Анализ выявленных вредных факторов проектируемой
производственной среды …………………………………………………………………….. 53
4.3. Микроклимат в помещении…………………………………………………………. 55
4.4. Освещенность ………………………………………………………………………………. 56
4.5. Электромагнитные поля………………………………………………………………. 60
4.6. Шум ………………………………………………………………………………………………. 61
4.7. Организация рабочего места оператора ПЭВМ ………………………….. 62
4.8. Анализ опасных производственных факторов ……………………………. 65
4.9. Электробезопасность ……………………………………………………………………. 65
4.10. Защита в чрезвычайных ситуациях …………………………………………… 68
4.11. Пожарная безопасность ……………………………………………………………… 69
4.12. Экологическая безопасность ……………………………………………………… 70
4.13. Научно техническая документация …………………………………………… 73
4.14. Выводы и рекомендации ………………………………………………………………. 74
Список литературы ……………………………………………………………………………….. 76
Приложение А. Пример данных о статье (XML формат) ……………………… 78
Приложение Б. Метод класса отправки запросов …………………………………. 79
Приложение В. Метод получения данных по номеру журнала …………….. 80
Приложение Г ………………………………………………………………………………………… 82
Приложение Д ………………………………………………………………………………………… 83
Приложение Е ………………………………………………………………………………………… 84

Теперь, как никогда ранее научное сообщество располагает огромным
количеством материала. Согласно некоторым исследованиям, объём
производства научных публикаций удваивается каждые девять лет [6].
Благодаря быстрому развитию информационно-коммуникационных
технологий (ИКТ), теперь можно получить доступ к большей части научной
литературы через интернет [7], что позволяет более эффективно передавать
знания. Однако этот процесс также ведёт к усилению конкуренции между
исследователями и увеличению требований к качеству материала. Эти
изменения побуждают исследователей, особенно тех, кто находится на ранних
этапах своей карьеры, сотрудничать с другими исследователями из своего или
другого учреждения. Динамичность такого партнёрства делает анализ сети
научного сотрудничества предметом большого интереса.
В основном для оценки автора используются индикаторы, полученные
через поисковые системы, такие как Google Scholar, Scopus и т.д., которые
включают количество и качество публикаций на основе журнальных и
авторских показателей. Тем не менее, эти критерии не учитывают взаимосвязь
между авторами. Хотя глобализация науки в современном мире обусловлена
сотрудничеством между исследователями и это стало большой проблемой
анализа эффективности работы конкретных авторов.
Данная работа направлена на определение структур сотрудничества
между исследователями в области «Экономики, Эконометрики и Финансов»
(ECON) и выявлении учреждений, направленных на данную тематику. В
качестве основного критерия используется сотрудничество в публикациях.
Доступ к данным осуществляется с помощью интерфейса Scopus Database API
[8].

Получена информация о 78354 статьях из области “Экономика, Эконометрика
и Финансы”, информация о 22712 авторах и их принадлежности к
университетам или научным организациям. Произведен первичный анализ
полученных данных. Все авторы были разбиты на кластеры, которые
основываются на взаимосвязи авторов через совместное написание работ.
Выявлена тенденция к неоднократному сотрудничества авторов,
занимающихся одной или смежными областями науки. Интерфейс реализован
на языке PHP, данные были выгружены в реляционную базу данных
PostgresSQL, анализ произведён при помощи языка R. Максимальное
количество соавторов для одной работы из статей, попавших в выборку,
равняется 39.

1)T.A. Brooks , Private acts and public objects: an investigation of citer
motivations, Journal of the American Society for Information Science 36(4) (1985)
223-229.
2)Bárbara S. Lancho-Barrantes, Vicente P. Guerrero-Bote, Félix Moya-
Anegón. What lies behind the averages and significance of citation indicators in
different disciplines? Article first published online: April 13, 2010. Volume: 36
issue: 3, page(s): 371-382.
3)Cristopher J. Date, Introduction to Database Systems, 2003.
4)Иванова Г.С. Основы программирования: Учебник для вузов. – М.:
Изд-во МГТУ им. Н.Э. Баумана, 2002. – 416 с.
5)Welling L., Thomson L. PHP and MySQL Web Development (4th
Edition). Addison-Wesley Professional, 2008 – 1008 p.
6)Noorden, R. V., 5 2014. Global scientific output doubles every nine
years.Mathematics&EconomicsNatureNewsBlog,
http://blogs.nature.com/news/2014/05/global-scientific-output-doubles-every-nine-
years.html.
7)Asadi, S., Dahlan, H. M., et al., 2017. Organizational research in the
field of green it: A systematic literature review from 2007 to 2016. Telematics and
Informatics.
8)Elsevier,2017.ScopusdatabaseAPIinterface.
https://dev.elsevier.com/ .
9)Uddin S., Hossain L., Rasmussen K. 2013. Network effect on scientific
collaborations. PloS One 8 (2), e57546
10) Schlattmann S., 2017. Capturing the collaboration intensity of research
institutions using social network analysis. Procedia Computer Science 106, 25–31.
11) Baghdadi, H. S., Ranaivo-Malan¸con, B., 2011. An automatic topic
identification algorithm. Journal of Computer Science 7 (9), 1363.
12) Can˜as-Guerrero, I., Mazarron, F., Pou-Merina, A., Calleja-Perucho,
C., Diaz Rubio, G., 2013. Bibliometric analysis of research activity in the
“agronomy” category from the web of science, 1997-2011. European Journal of
Agronomy 50 19–28.
13) Szymanski, B., De La Rosa, J., Krishnamoorthy, M., 2012. An internet
measure of the value of citations. Information Sciences 185 (1), 18–31.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Катерина В. преподаватель, кандидат наук
    4.6 (30 отзывов)
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации... Читать все
    Преподаватель одного из лучших ВУЗов страны, научный работник, редактор научного журнала, общественный деятель. Пишу все виды работ - от эссе до докторской диссертации. Опыт работы 7 лет. Всегда на связи и готова прийти на помощь. Вместе удовлетворим самого требовательного научного руководителя. Возможно полное сопровождение: от статуса студента до получения научной степени.
    #Кандидатские #Магистерские
    47 Выполненных работ
    Дмитрий К. преподаватель, кандидат наук
    5 (1241 отзыв)
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполня... Читать все
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполняю уже 30 лет.
    #Кандидатские #Магистерские
    2271 Выполненная работа
    Екатерина П. студент
    5 (18 отзывов)
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно... Читать все
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно занимаюсь английским языком, уровень владения - Upper-Intermediate.
    #Кандидатские #Магистерские
    39 Выполненных работ
    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Антон П. преподаватель, доцент
    4.8 (1033 отзыва)
    Занимаюсь написанием студенческих работ (дипломные работы, маг. диссертации). Участник международных конференций (экономика/менеджмент/юриспруденция). Постоянно публик... Читать все
    Занимаюсь написанием студенческих работ (дипломные работы, маг. диссертации). Участник международных конференций (экономика/менеджмент/юриспруденция). Постоянно публикуюсь, имею высокий индекс цитирования. Спикер.
    #Кандидатские #Магистерские
    1386 Выполненных работ
    Мария Б. преподаватель, кандидат наук
    5 (22 отзыва)
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальнос... Читать все
    Окончила специалитет по направлению "Прикладная информатика в экономике", магистратуру по направлению "Торговое дело". Защитила кандидатскую диссертацию по специальности "Экономика и управление народным хозяйством". Автор научных статей.
    #Кандидатские #Магистерские
    37 Выполненных работ
    Яна К. ТюмГУ 2004, ГМУ, выпускник
    5 (8 отзывов)
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соот... Читать все
    Помощь в написании магистерских диссертаций, курсовых, контрольных работ, рефератов, статей, повышение уникальности текста(ручной рерайт), качественно и в срок, в соответствии с Вашими требованиями.
    #Кандидатские #Магистерские
    12 Выполненных работ
    Александра С.
    5 (91 отзыв)
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повы... Читать все
    Красный диплом референта-аналитика информационных ресурсов, 8 лет преподавания. Опыт написания работ вплоть до докторских диссертаций. Отдельно специализируюсь на повышении уникальности текста и оформлении библиографических ссылок по ГОСТу.
    #Кандидатские #Магистерские
    132 Выполненных работы

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет