Эффективный анализ больших данных, извлеченных из наукометрической базы Scopus

Неретин, Артём Александрович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Данная работа описывает основные моменты разработки программного обеспечения для выгрузки и анализа данных из API Scopus, предоставляемое Elsevier. Представлены методы кластерного анализа для построения взаимосвязей на основе графов.

Введение …………………………………………………………………………………………………. 12
Глава 1. Теоретическая часть ………………………………………………………………… 13
1.1. Методика расчёта CiteScore………………………………………………………….. 13
1.2. Реляционная база данных PostgreSQL ………………………………………… 14
1.3. GET и POST запросы……………………………………………………………………. 15
1.4. Наукометрические базы данных………………………………………………….. 15
1.5. Выгрузка данных …………………………………………………………………………. 18
1.6. Кластерный анализ ………………………………………………………………………. 20
1.7. Облако тегов ………………………………………………………………………………… 21
Глава 2. Практическая часть…………………………………………………………………. 23
2.1. Разработка и реализация структуры базы данных ……………………… 23
2.2. Выгрузка данных с использованием автоматизированного скрипта
…………………………………………………………………………………………………………….. 24
2.3. Первичный количественный анализ …………………………………………… 26
2.4. Построение облака тегов ……………………………………………………………… 27
2.5. Выделение кластеров ученных ……………………………………………………. 28
2.6. Построение облака тегов имён авторов ………………………………………. 32
2.7. Анализ кластеров …………………………………………………………………………. 32
Глава 3. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение …………………………………………………………………………………. 34
3.1. Потенциальные потребители результатов исследования …………… 34
3.2. Анализ конкурентных технических решений с позиции
ресурсоэффективности и ресурсосбережения…………………………………….. 34
3.3. Диаграмма Исикава……………………………………………………………………… 36
3.4. SWOT-анализ ……………………………………………………………………………….. 37
3.5. Оценка готовности проекта к коммерциализации ……………………… 38
3.6. Методы коммерциализации результатов научно-технического
исследования. ……………………………………………………………………………………….. 40
3.5. Инициация проекта ……………………………………………………………………… 40
3.5.1 Цели и результат проекта. …………………………………………………………………………………………40
3.5.2 Организационная структура проекта. …………………………………………………………………….41
3.5.3 Ограничения и допущения проекта. ……………………………………………………………………….42
3.6. Планирование управления научно-техническим проектом ……….. 42
3.6.1. План проекта ……………………………………………………………………………………………………..42
3.6.3. Бюджет научного исследования ……………………………………………………………………………..46
3.6.4. Организационная структура проекта …………………………………………………………………….47
3.6.5. Расчёт электроэнергии ……………………………………………………………………………………………47
3.6.6. Накладные расходы ………………………………………………………………………………………………..47
3.6.7. Бюджет научного исследования ……………………………………………………………………………..48
3.6.8. Реестр рисков проекта …………………………………………………………………………………………….49

3.7. Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности
исследования ………………………………………………………………………………………. 50
3.7.1 Оценка сравнительной эффективности исследования ……………………………………..50

Глава 4. Социальная ответственность. …………………………………………………. 52
1. Социальная ответственность …………………………………………………………….. 52
4.1. Описание рабочего места……………………………………………………………… 52
4.2. Анализ выявленных вредных факторов проектируемой
производственной среды …………………………………………………………………….. 53
4.3. Микроклимат в помещении…………………………………………………………. 55
4.4. Освещенность ………………………………………………………………………………. 56
4.5. Электромагнитные поля………………………………………………………………. 60
4.6. Шум ………………………………………………………………………………………………. 61
4.7. Организация рабочего места оператора ПЭВМ ………………………….. 62
4.8. Анализ опасных производственных факторов ……………………………. 65
4.9. Электробезопасность ……………………………………………………………………. 65
4.10. Защита в чрезвычайных ситуациях …………………………………………… 68
4.11. Пожарная безопасность ……………………………………………………………… 69
4.12. Экологическая безопасность ……………………………………………………… 70
4.13. Научно техническая документация …………………………………………… 73
4.14. Выводы и рекомендации ………………………………………………………………. 74
Список литературы ……………………………………………………………………………….. 76
Приложение А. Пример данных о статье (XML формат) ……………………… 78
Приложение Б. Метод класса отправки запросов …………………………………. 79
Приложение В. Метод получения данных по номеру журнала …………….. 80
Приложение Г ………………………………………………………………………………………… 82
Приложение Д ………………………………………………………………………………………… 83
Приложение Е ………………………………………………………………………………………… 84

Теперь, как никогда ранее научное сообщество располагает огромным
количеством материала. Согласно некоторым исследованиям, объём
производства научных публикаций удваивается каждые девять лет [6].
Благодаря быстрому развитию информационно-коммуникационных
технологий (ИКТ), теперь можно получить доступ к большей части научной
литературы через интернет [7], что позволяет более эффективно передавать
знания. Однако этот процесс также ведёт к усилению конкуренции между
исследователями и увеличению требований к качеству материала. Эти
изменения побуждают исследователей, особенно тех, кто находится на ранних
этапах своей карьеры, сотрудничать с другими исследователями из своего или
другого учреждения. Динамичность такого партнёрства делает анализ сети
научного сотрудничества предметом большого интереса.
В основном для оценки автора используются индикаторы, полученные
через поисковые системы, такие как Google Scholar, Scopus и т.д., которые
включают количество и качество публикаций на основе журнальных и
авторских показателей. Тем не менее, эти критерии не учитывают взаимосвязь
между авторами. Хотя глобализация науки в современном мире обусловлена
сотрудничеством между исследователями и это стало большой проблемой
анализа эффективности работы конкретных авторов.
Данная работа направлена на определение структур сотрудничества
между исследователями в области «Экономики, Эконометрики и Финансов»
(ECON) и выявлении учреждений, направленных на данную тематику. В
качестве основного критерия используется сотрудничество в публикациях.
Доступ к данным осуществляется с помощью интерфейса Scopus Database API
[8].

Получена информация о 78354 статьях из области “Экономика, Эконометрика
и Финансы”, информация о 22712 авторах и их принадлежности к
университетам или научным организациям. Произведен первичный анализ
полученных данных. Все авторы были разбиты на кластеры, которые
основываются на взаимосвязи авторов через совместное написание работ.
Выявлена тенденция к неоднократному сотрудничества авторов,
занимающихся одной или смежными областями науки. Интерфейс реализован
на языке PHP, данные были выгружены в реляционную базу данных
PostgresSQL, анализ произведён при помощи языка R. Максимальное
количество соавторов для одной работы из статей, попавших в выборку,
равняется 39.

1)T.A. Brooks , Private acts and public objects: an investigation of citer
motivations, Journal of the American Society for Information Science 36(4) (1985)
223-229.
2)Bárbara S. Lancho-Barrantes, Vicente P. Guerrero-Bote, Félix Moya-
Anegón. What lies behind the averages and significance of citation indicators in
different disciplines? Article first published online: April 13, 2010. Volume: 36
issue: 3, page(s): 371-382.
3)Cristopher J. Date, Introduction to Database Systems, 2003.
4)Иванова Г.С. Основы программирования: Учебник для вузов. – М.:
Изд-во МГТУ им. Н.Э. Баумана, 2002. – 416 с.
5)Welling L., Thomson L. PHP and MySQL Web Development (4th
Edition). Addison-Wesley Professional, 2008 – 1008 p.
6)Noorden, R. V., 5 2014. Global scientific output doubles every nine
years.Mathematics&EconomicsNatureNewsBlog,
http://blogs.nature.com/news/2014/05/global-scientific-output-doubles-every-nine-
years.html.
7)Asadi, S., Dahlan, H. M., et al., 2017. Organizational research in the
field of green it: A systematic literature review from 2007 to 2016. Telematics and
Informatics.
8)Elsevier,2017.ScopusdatabaseAPIinterface.
https://dev.elsevier.com/ .
9)Uddin S., Hossain L., Rasmussen K. 2013. Network effect on scientific
collaborations. PloS One 8 (2), e57546
10) Schlattmann S., 2017. Capturing the collaboration intensity of research
institutions using social network analysis. Procedia Computer Science 106, 25–31.
11) Baghdadi, H. S., Ranaivo-Malan¸con, B., 2011. An automatic topic
identification algorithm. Journal of Computer Science 7 (9), 1363.
12) Can˜as-Guerrero, I., Mazarron, F., Pou-Merina, A., Calleja-Perucho,
C., Diaz Rubio, G., 2013. Bibliometric analysis of research activity in the
“agronomy” category from the web of science, 1997-2011. European Journal of
Agronomy 50 19–28.
13) Szymanski, B., De La Rosa, J., Krishnamoorthy, M., 2012. An internet
measure of the value of citations. Information Sciences 185 (1), 18–31.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Шагали Е. УрГЭУ 2007, Экономика, преподаватель
    4.4 (59 отзывов)
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и... Читать все
    Серьезно отношусь к тренировке собственного интеллекта, поэтому постоянно учусь сама и с удовольствием пишу для других. За 15 лет работы выполнила более 600 дипломов и диссертаций, Есть любимые темы - они дешевле обойдутся, ибо в радость)
    #Кандидатские #Магистерские
    76 Выполненных работ
    Анна Александровна Б. Воронежский государственный университет инженерных технол...
    4.8 (30 отзывов)
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственно... Читать все
    Окончила магистратуру Воронежского государственного университета в 2009 г. В 2014 г. защитила кандидатскую диссертацию. С 2010 г. преподаю в Воронежском государственном университете инженерных технологий.
    #Кандидатские #Магистерские
    66 Выполненных работ
    Ксения М. Курганский Государственный Университет 2009, Юридический...
    4.8 (105 отзывов)
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитыв... Читать все
    Работаю только по книгам, учебникам, статьям и диссертациям. Никогда не использую технические способы поднятия оригинальности. Только авторские работы. Стараюсь учитывать все требования и пожелания.
    #Кандидатские #Магистерские
    213 Выполненных работ
    Дарья Б. МГУ 2017, Журналистики, выпускник
    4.9 (35 отзывов)
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных ко... Читать все
    Привет! Меня зовут Даша, я окончила журфак МГУ с красным дипломом, защитила магистерскую диссертацию на филфаке. Работала журналистом, PR-менеджером в международных компаниях, сейчас работаю редактором. Готова помогать вам с учёбой!
    #Кандидатские #Магистерские
    50 Выполненных работ
    Дмитрий Л. КНЭУ 2015, Экономики и управления, выпускник
    4.8 (2878 отзывов)
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    Занимаю 1 место в рейтинге исполнителей по категориям работ "Научные статьи" и "Эссе". Пишу дипломные работы и магистерские диссертации.
    #Кандидатские #Магистерские
    5125 Выполненных работ
    Анастасия Б.
    5 (145 отзывов)
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическо... Читать все
    Опыт в написании студенческих работ (дипломные работы, магистерские диссертации, повышение уникальности текста, курсовые работы, научные статьи и т.д.) по экономическому и гуманитарному направлениях свыше 8 лет на различных площадках.
    #Кандидатские #Магистерские
    224 Выполненных работы
    Анна В. Инжэкон, студент, кандидат наук
    5 (21 отзыв)
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссе... Читать все
    Выполняю работы по экономическим дисциплинам. Маркетинг, менеджмент, управление персоналом. управление проектами. Есть опыт написания магистерских и кандидатских диссертаций. Работала в маркетинге. Практикующий бизнес-консультант.
    #Кандидатские #Магистерские
    31 Выполненная работа
    Ольга Р. доктор, профессор
    4.2 (13 отзывов)
    Преподаватель ВУЗа, опыт выполнения студенческих работ на заказ (от рефератов до диссертаций): 20 лет. Образование высшее . Все заказы выполняются в заранее согласован... Читать все
    Преподаватель ВУЗа, опыт выполнения студенческих работ на заказ (от рефератов до диссертаций): 20 лет. Образование высшее . Все заказы выполняются в заранее согласованные сроки и при необходимости дорабатываются по рекомендациям научного руководителя (преподавателя). Буду рада плодотворному и взаимовыгодному сотрудничеству!!! К каждой работе подхожу индивидуально! Всегда готова по любому вопросу договориться с заказчиком! Все работы проверяю на антиплагиат.ру по умолчанию, если в заказе не стоит иное и если это заранее не обговорено!!!
    #Кандидатские #Магистерские
    21 Выполненная работа
    Вирсавия А. медицинский 1981, стоматологический, преподаватель, канди...
    4.5 (9 отзывов)
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - ... Читать все
    руководитель успешно защищенных диссертаций, автор около 150 работ, в активе - оппонирование, рецензирование, написание и подготовка диссертационных работ; интересы - медицина, биология, антропология, биогидродинамика
    #Кандидатские #Магистерские
    12 Выполненных работ

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет