Эффективный анализ больших данных, извлеченных из наукометрической базы Scopus

Неретин, Артём Александрович Отделение экспериментальной физики (ОЭФ)
Бесплатно
В избранное
Работа доступна по лицензии Creative Commons:«Attribution» 4.0

Данная работа описывает основные моменты разработки программного обеспечения для выгрузки и анализа данных из API Scopus, предоставляемое Elsevier. Представлены методы кластерного анализа для построения взаимосвязей на основе графов.

Введение …………………………………………………………………………………………………. 12
Глава 1. Теоретическая часть ………………………………………………………………… 13
1.1. Методика расчёта CiteScore………………………………………………………….. 13
1.2. Реляционная база данных PostgreSQL ………………………………………… 14
1.3. GET и POST запросы……………………………………………………………………. 15
1.4. Наукометрические базы данных………………………………………………….. 15
1.5. Выгрузка данных …………………………………………………………………………. 18
1.6. Кластерный анализ ………………………………………………………………………. 20
1.7. Облако тегов ………………………………………………………………………………… 21
Глава 2. Практическая часть…………………………………………………………………. 23
2.1. Разработка и реализация структуры базы данных ……………………… 23
2.2. Выгрузка данных с использованием автоматизированного скрипта
…………………………………………………………………………………………………………….. 24
2.3. Первичный количественный анализ …………………………………………… 26
2.4. Построение облака тегов ……………………………………………………………… 27
2.5. Выделение кластеров ученных ……………………………………………………. 28
2.6. Построение облака тегов имён авторов ………………………………………. 32
2.7. Анализ кластеров …………………………………………………………………………. 32
Глава 3. Финансовый менеджмент, ресурсоэффективность и
ресурсосбережение …………………………………………………………………………………. 34
3.1. Потенциальные потребители результатов исследования …………… 34
3.2. Анализ конкурентных технических решений с позиции
ресурсоэффективности и ресурсосбережения…………………………………….. 34
3.3. Диаграмма Исикава……………………………………………………………………… 36
3.4. SWOT-анализ ……………………………………………………………………………….. 37
3.5. Оценка готовности проекта к коммерциализации ……………………… 38
3.6. Методы коммерциализации результатов научно-технического
исследования. ……………………………………………………………………………………….. 40
3.5. Инициация проекта ……………………………………………………………………… 40
3.5.1 Цели и результат проекта. …………………………………………………………………………………………40
3.5.2 Организационная структура проекта. …………………………………………………………………….41
3.5.3 Ограничения и допущения проекта. ……………………………………………………………………….42
3.6. Планирование управления научно-техническим проектом ……….. 42
3.6.1. План проекта ……………………………………………………………………………………………………..42
3.6.3. Бюджет научного исследования ……………………………………………………………………………..46
3.6.4. Организационная структура проекта …………………………………………………………………….47
3.6.5. Расчёт электроэнергии ……………………………………………………………………………………………47
3.6.6. Накладные расходы ………………………………………………………………………………………………..47
3.6.7. Бюджет научного исследования ……………………………………………………………………………..48
3.6.8. Реестр рисков проекта …………………………………………………………………………………………….49

3.7. Определение ресурсной (ресурсосберегающей), финансовой,
бюджетной, социальной и экономической эффективности
исследования ………………………………………………………………………………………. 50
3.7.1 Оценка сравнительной эффективности исследования ……………………………………..50

Глава 4. Социальная ответственность. …………………………………………………. 52
1. Социальная ответственность …………………………………………………………….. 52
4.1. Описание рабочего места……………………………………………………………… 52
4.2. Анализ выявленных вредных факторов проектируемой
производственной среды …………………………………………………………………….. 53
4.3. Микроклимат в помещении…………………………………………………………. 55
4.4. Освещенность ………………………………………………………………………………. 56
4.5. Электромагнитные поля………………………………………………………………. 60
4.6. Шум ………………………………………………………………………………………………. 61
4.7. Организация рабочего места оператора ПЭВМ ………………………….. 62
4.8. Анализ опасных производственных факторов ……………………………. 65
4.9. Электробезопасность ……………………………………………………………………. 65
4.10. Защита в чрезвычайных ситуациях …………………………………………… 68
4.11. Пожарная безопасность ……………………………………………………………… 69
4.12. Экологическая безопасность ……………………………………………………… 70
4.13. Научно техническая документация …………………………………………… 73
4.14. Выводы и рекомендации ………………………………………………………………. 74
Список литературы ……………………………………………………………………………….. 76
Приложение А. Пример данных о статье (XML формат) ……………………… 78
Приложение Б. Метод класса отправки запросов …………………………………. 79
Приложение В. Метод получения данных по номеру журнала …………….. 80
Приложение Г ………………………………………………………………………………………… 82
Приложение Д ………………………………………………………………………………………… 83
Приложение Е ………………………………………………………………………………………… 84

Теперь, как никогда ранее научное сообщество располагает огромным
количеством материала. Согласно некоторым исследованиям, объём
производства научных публикаций удваивается каждые девять лет [6].
Благодаря быстрому развитию информационно-коммуникационных
технологий (ИКТ), теперь можно получить доступ к большей части научной
литературы через интернет [7], что позволяет более эффективно передавать
знания. Однако этот процесс также ведёт к усилению конкуренции между
исследователями и увеличению требований к качеству материала. Эти
изменения побуждают исследователей, особенно тех, кто находится на ранних
этапах своей карьеры, сотрудничать с другими исследователями из своего или
другого учреждения. Динамичность такого партнёрства делает анализ сети
научного сотрудничества предметом большого интереса.
В основном для оценки автора используются индикаторы, полученные
через поисковые системы, такие как Google Scholar, Scopus и т.д., которые
включают количество и качество публикаций на основе журнальных и
авторских показателей. Тем не менее, эти критерии не учитывают взаимосвязь
между авторами. Хотя глобализация науки в современном мире обусловлена
сотрудничеством между исследователями и это стало большой проблемой
анализа эффективности работы конкретных авторов.
Данная работа направлена на определение структур сотрудничества
между исследователями в области «Экономики, Эконометрики и Финансов»
(ECON) и выявлении учреждений, направленных на данную тематику. В
качестве основного критерия используется сотрудничество в публикациях.
Доступ к данным осуществляется с помощью интерфейса Scopus Database API
[8].

Получена информация о 78354 статьях из области “Экономика, Эконометрика
и Финансы”, информация о 22712 авторах и их принадлежности к
университетам или научным организациям. Произведен первичный анализ
полученных данных. Все авторы были разбиты на кластеры, которые
основываются на взаимосвязи авторов через совместное написание работ.
Выявлена тенденция к неоднократному сотрудничества авторов,
занимающихся одной или смежными областями науки. Интерфейс реализован
на языке PHP, данные были выгружены в реляционную базу данных
PostgresSQL, анализ произведён при помощи языка R. Максимальное
количество соавторов для одной работы из статей, попавших в выборку,
равняется 39.

1)T.A. Brooks , Private acts and public objects: an investigation of citer
motivations, Journal of the American Society for Information Science 36(4) (1985)
223-229.
2)Bárbara S. Lancho-Barrantes, Vicente P. Guerrero-Bote, Félix Moya-
Anegón. What lies behind the averages and significance of citation indicators in
different disciplines? Article first published online: April 13, 2010. Volume: 36
issue: 3, page(s): 371-382.
3)Cristopher J. Date, Introduction to Database Systems, 2003.
4)Иванова Г.С. Основы программирования: Учебник для вузов. – М.:
Изд-во МГТУ им. Н.Э. Баумана, 2002. – 416 с.
5)Welling L., Thomson L. PHP and MySQL Web Development (4th
Edition). Addison-Wesley Professional, 2008 – 1008 p.
6)Noorden, R. V., 5 2014. Global scientific output doubles every nine
years.Mathematics&EconomicsNatureNewsBlog,
http://blogs.nature.com/news/2014/05/global-scientific-output-doubles-every-nine-
years.html.
7)Asadi, S., Dahlan, H. M., et al., 2017. Organizational research in the
field of green it: A systematic literature review from 2007 to 2016. Telematics and
Informatics.
8)Elsevier,2017.ScopusdatabaseAPIinterface.
https://dev.elsevier.com/ .
9)Uddin S., Hossain L., Rasmussen K. 2013. Network effect on scientific
collaborations. PloS One 8 (2), e57546
10) Schlattmann S., 2017. Capturing the collaboration intensity of research
institutions using social network analysis. Procedia Computer Science 106, 25–31.
11) Baghdadi, H. S., Ranaivo-Malan¸con, B., 2011. An automatic topic
identification algorithm. Journal of Computer Science 7 (9), 1363.
12) Can˜as-Guerrero, I., Mazarron, F., Pou-Merina, A., Calleja-Perucho,
C., Diaz Rubio, G., 2013. Bibliometric analysis of research activity in the
“agronomy” category from the web of science, 1997-2011. European Journal of
Agronomy 50 19–28.
13) Szymanski, B., De La Rosa, J., Krishnamoorthy, M., 2012. An internet
measure of the value of citations. Information Sciences 185 (1), 18–31.

Заказать новую

Лучшие эксперты сервиса ждут твоего задания

от 5 000 ₽

Не подошла эта работа?
Закажи новую работу, сделанную по твоим требованиям

    Нажимая на кнопку, я соглашаюсь на обработку персональных данных и с правилами пользования Платформой

    Хочешь уникальную работу?

    Больше 3 000 экспертов уже готовы начать работу над твоим проектом!

    Евгений А. доктор, профессор
    5 (154 отзыва)
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - ... Читать все
    Более 40 лет занимаюсь преподавательской деятельностью. Специалист в области философии, логики и социальной работы. Кандидатская диссертация - по логике, докторская - по социальной работе.
    #Кандидатские #Магистерские
    260 Выполненных работ
    Мария А. кандидат наук
    4.7 (18 отзывов)
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет... Читать все
    Мне нравится изучать все новое, постоянно развиваюсь. Могу написать и диссертацию и кандидатскую. Есть опыт в различных сфера деятельности (туризм, экономика, бухучет, реклама, журналистика, педагогика, право)
    #Кандидатские #Магистерские
    39 Выполненных работ
    Александр О. Спб государственный университет 1972, мат - мех, преподав...
    4.9 (66 отзывов)
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальн... Читать все
    Читаю лекции и веду занятия со студентами по матанализу, линейной алгебре и теории вероятностей. Защитил кандидатскую диссертацию по качественной теории дифференциальных уравнений. Умею быстро и четко выполнять сложные вычислительные работ
    #Кандидатские #Магистерские
    117 Выполненных работ
    Екатерина П. студент
    5 (18 отзывов)
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно... Читать все
    Работы пишу исключительно сама на основании действующих нормативных правовых актов, монографий, канд. и докт. диссертаций, авторефератов, научных статей. Дополнительно занимаюсь английским языком, уровень владения - Upper-Intermediate.
    #Кандидатские #Магистерские
    39 Выполненных работ
    Кормчий В.
    4.3 (248 отзывов)
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    Специализация: диссертации; дипломные и курсовые работы; научные статьи.
    #Кандидатские #Магистерские
    335 Выполненных работ
    Татьяна М. кандидат наук
    5 (285 отзывов)
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    Специализируюсь на правовых дипломных работах, магистерских и кандидатских диссертациях
    #Кандидатские #Магистерские
    495 Выполненных работ
    Татьяна П. МГУ им. Ломоносова 1930, выпускник
    5 (9 отзывов)
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по и... Читать все
    Журналист. Младший научный сотрудник в институте РАН. Репетитор по английскому языку (стаж 6 лет). Также знаю французский. Сейчас занимаюсь написанием диссертации по истории. Увлекаюсь литературой и темой космоса.
    #Кандидатские #Магистерские
    11 Выполненных работ
    Дмитрий К. преподаватель, кандидат наук
    5 (1241 отзыв)
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполня... Читать все
    Окончил КазГУ с красным дипломом в 1985 г., после окончания работал в Институте Ядерной Физики, защитил кандидатскую диссертацию в 1991 г. Работы для студентов выполняю уже 30 лет.
    #Кандидатские #Магистерские
    2271 Выполненная работа
    Петр П. кандидат наук
    4.2 (25 отзывов)
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт напис... Читать все
    Выполняю различные работы на заказ с 2014 года. В основном, курсовые проекты, дипломные и выпускные квалификационные работы бакалавриата, специалитета. Имею опыт написания магистерских диссертаций. Направление - связь, телекоммуникации, информационная безопасность, информационные технологии, экономика. Пишу научные статьи уровня ВАК и РИНЦ. Работаю техническим директором интернет-провайдера, имею опыт работы ведущим сотрудником отдела информационной безопасности филиала одного из крупнейших банков. Образование - высшее профессиональное (в 2006 году окончил военную Академию связи в г. Санкт-Петербурге), послевузовское профессиональное (в 2018 году окончил аспирантуру Уральского федерального университета). Защитил диссертацию на соискание степени "кандидат технических наук" в 2020 году. В качестве хобби преподаю. Дисциплины - сети ЭВМ и телекоммуникации, информационная безопасность объектов критической информационной инфраструктуры.
    #Кандидатские #Магистерские
    33 Выполненных работы

    Другие учебные работы по предмету

    Кооперативные игры на гиперграфах
    📅 2019год
    🏢 Санкт-Петербургский государственный университет