Ассортативность это: ассортативность | это… Что такое ассортативность?

Опубликовано 16.05.202307.04.2023 автором alexxlab

Содержание

Выгодный союз – Новости – Научно-образовательный портал IQ – Национальный исследовательский университет «Высшая школа экономики»

Во многих развитых странах распространение семейных пар, в которых супруги имеют одинаковый уровень образования, усиливает неравенство доходов. Насколько эта ситуация типична для России, проанализировали исследователи НИУ ВШЭ в статье «Ассортативность браков по образованию и неравенство доходов».

Дарья Зинченко и Анна Лукьянова провели анализ на основе данных Российского мониторинга экономического положения и здоровья населения НИУ ВШЭ (RLMS-HSE), используя показатели за 1995, 2000, 2005, 2010 и 2015 годы. В выборку исследования вошли более 13 тысяч семейных пар, в которых оба супруга были старше 18 лет и имели сведения об уровне образования и доходах. Доходы семей рассчитывались как сумма индивидуальных доходов супругов за последние 30 дней и включали заработные платы, пенсии и пособия по безработице.

В первую очередь исследователи рассмотрели динамику ассортативности браков по образованию.

Ассортативность — это формирование семейных пар по принципу наличия или отсутствия одинаковых черт у супругов. Позитивной (положительной) ассортативностью считается выбор партнера со схожими характеристиками. Будь то аналогичный уровень образования, социальный статус семьи или физические данные человека, как рост и конституция тела в целом. Если сходств между партнерами нет, тогда речь идет о негативной (отрицательной) ассортативности.

Анализ данных показал, что на протяжении 20 лет почти половина семейных пар в России были образованы между людьми с одинаковым уровнем образования. В 1995 году доля таких пар составляла 50%, в 2015 — 46%.

Если рассмотреть распределение этих пар по уровням образования, то значительно выросла доля союзов между людьми с высшим образованием: с 9,4% до 15,7%. Связывают это с увеличением общего числа образованных людей в стране. Несмотря на то, что количество супружеских пар среди выпускников вузов увеличилось, в целом положительная ассортативность браков среди людей с высшим образованием снизилась.

Причина тому — гендерный дисбаланс среди выпускников вузов. Доля замужних женщин с высшим образованием к 2015 году достигла 31%, тогда как доля женатых мужчин составила лишь 24%. В 1995 году данные показатели были равны. Это означает, что стали чаще встречаться пары, в которых жена образованнее мужа. Следовательно, женщины стали менее требовательны к уровню образования своего избранника.

За 20 лет стало немного больше (на 1,6%) браков между людьми со средним профессиональным образованием. Их доля к 2015 году достигла 8,6%. Вместе с тем сократилось число семей, где оба супруга имели общее среднее и более низкий уровень образования: с 20,7% до 15,5% и с 13,1% до 5,7% соответственно.

В целом на всех ступенях образования наблюдается позитивная ассортативность. Особенно это свойственно людям старше 50 лет, в то время как молодежь в возрасте от 18 до 35 лет стала меньше придавать значение этому фактору. Ученые предполагают, что этому феномену могут быть предложены экономические и социологические объяснения.

По словам Анны Лукьяновой, с экономической точки зрения, рост образования, эмансипация женщин и падение рождаемости снижают их экономическую зависимость от мужчин и делают более свободными в выборе супругов. Социологи чаще связывают снижение позитивной ассортативности браков с ослаблением жесткости социальных структур, их большей открытостью для «чужаков» и снижением социальных барьеров для «неравных» браков. Повышение среднего возраста вступления в брак, рост урбанизации и развитие миграции в современном обществе снижают роль социальных ограничений, и на первое место при заключении браков выходят мотивы «романтической любви».

Что касается доходов семей, то статистика подтверждает их прямую связь с уровнем образования. Даже если диплом об окончании вуза имеет лишь один из супругов, совокупный доход пары увеличивается. Причем высшее образование жены дает больший прирост семейных доходов, чем если бы диплом был только у мужа.

Исследователи также отметили, что за 20 лет существенно сократился гендерный разрыв в доходах внутри семей. Если в 1995 году медианный уровень заработка жен составлял 61% от дохода мужа, то в 2015 году этот показатель превысил 73%.

Проведенные расчеты показали, что неравенство по семейным доходам сократилось за рассматриваемый период. Коэффициент Джини, который измеряется от 0 до 1 и показывает степень расслоения общества (чем дальше от 0, тем сильнее расслоение), за 20 лет уменьшился на 29% процентов. Однако изменения в уровне ассортативности имели слабое отношение к снижению неравенства — оно происходило по другим причинам.

Позитивная ассортативность браков по уровню образования вообще мало влияет на неравенство. Максимально она добавляет 1,3% к коэффициенту Джини. Это намного ниже, чем в других странах. Например, в США в 2007 году образовательная ассортативность браков увеличивала коэффициент Джини на 5%, а в Норвегии — на 4%.

Такой сравнительно низкий эффект образовательной ассортативности на неравенство доходов ученые связывают с низким уровнем заработных плат в бюджетном секторе, в котором трудится значительная часть людей с высшим образованием. Еще одной возможной причиной является сохранение уравнительной пенсионной системы, когда размеры пенсий слабо связаны с предыдущими заработками. Анализ этих причин будет продолжен в дальнейших исследованиях.

Авторы исследования:

Анна Лукьянова, доцент департамента прикладной экономики факультета экономических наук НИУ ВШЭ

Дарья Зинченко, аспирант департамента прикладной экономики факультета экономических наук НИУ ВШЭ

Автор текста: Тарасова Алёна Юрьевна, 11 сентября, 2018 г.

Все материалы автора

Экономика доходы образование семья

31. . Положительная ассортативность скрещивания.

Ассортативные (предпочтительные) скрещивания – это неслучайные скрещивания, когда особи с определённым генотипом (сходным или различным) скрещиваются между собой чаще, чем это ожидается. Если пары образованы особями с близкими фенотипами, то говорят о положительной ассортативности, а если фенотипы различаются – об отрицательной ассортативности скрещивания

Если равенство нарушено в пользу гомозигот (4DR > H²), то говорят, что имело место ассортативное скрещивание – предпочтительное скрещивание между «родственными» генотипами.

Если же в популяции наблюдается избыток гетерозигот (H²> 4DR), то говорят, что имеет место диссортативное скрещивание – предпочтительное скрещивание между «неродственными» генотипами.

При положительном ассортативном скрещивании (или просто ассортативном скрещивании) возможны следующие варианты объединения генотипов:

Таблица

При положительном ассортативном скрещивании частоты генов в популяции не меняются, т.е. частота какого-либо гена в родительской популяции и в популяции потомков будет одинаковой.

Если частота генов при положительном ассортативном скрещивании сохраняется, то частоты генотипов в ряду поколений претерпевают значительные изменения.

Исчезновение при положительном ассортативном скрещивании гетерозигот напоминает эффект гомозиготизации при инбридинге, однако, скорость гомозиготизации в этом случае много меньшая, чем при инбридинге (Малецкий, 1995).

Если схема наследования – полное доминирование (красные цветки А-, белые аа), то подбор пар приводит к скрещиванию особей, принадлежащих только у двум фенотипическим классам: А- х А-, аа х аа.

Можно показать, что в этом случае p – исходная частота аллеля А – не изменяется в ряду поколений ассортативного скрещивания, а f₁(t) – доля гетерозигот Аа – меняется в ряду поколений t следующим образом:

где f₁ – доля гетерозигот Аа в исходной популяции.

t 0 1 2 3 4 5

f1(t)

Самооп. 0,5 0,25 0,125 0,06 0,03 0,01

f1(t)

Ассорт. 0,5 0,33 0,25 0,20 0,17 0,14

Примеры положительного ассортативного скрещивания у растений и человека.

Положительная ассортативность скрещивания может проявляться и у растений, когда опылитель кормится на определённой высоте или его привлекают цветки данного цвета и, в результате, опыляются сходные растения и на растения попадает пыльца только с тех растений-опылителей, которые цветут одновременно с опыляемыми (Ф. Хедрик, 2003).

У человека, по-видимому, существует положительная ассортативность браков по таким вариабельным признакам, как рост, цвет кожи, интеллект (Vogel, Motulsky, 1997), хотя эта корреляция часто не очень высока.

Диссортативное скрещивание (отрицательное ассортативное скрещивание).

Если в популяции скрещивания происходят только между особями различных фенотипов (например, между особями с доминантными и рецессивными признаками), то такие скрещивания называют диссортативными.

В такой системе скрещивания в популяции почти полностью отсутствуют особи, гомозиготные по доминантному аллелю

Например, если в популяции представлены особи двух гено- и фенотипов (Аа и аа), то при диссортативном скрещивании возможны два варианта переопыления у растений с обоеполыми цветками: ♀♂аа х ♀♂Аа и ♀♂Аа х ♀♂аа.

Равновесное состояние в такой популяции достигается сразу же, независимо от первоначального состава популяции: (0; 0,5; 0,5). Описываемый тип скрещивания характерен для растений, обладающих гетеростилией.

Например, у некоторых видов растений имеется два типа цветков, которые различаются по высоте столбика с рыльцем, что приводит к необходимости перекрёстного опыления между этими типами (Barret, 1990). Такое явление называется гетеростилией.

Гетеростилия наследуется как простой менделеевский фактор. Генотип растений с короткостолбчатыми цветками обозначается Ss, а генотип с длинностолбчатыми цветками ss. Доминантные и рецессивные аллели S – локуса представляют собой суперген – тесно сцепленные гены, иногда разделяемые кроссинговером

У гречихи, например, соответствующие аллели обозначают L, l (вместо А, а).

Диссортативное скрещивание имеет место во всех раздельнополых популяциях, в частности и у растений: если отождествить аллель а с целой Х-хромосомой, аллель А с Y- хромосомой, то в популяции происходит скрещивание типа ХХ х ХY.

В результате возникает равновесное соотношение двух генотипов ХХ и ХY.

К диссортативному можно отнести также скрещивание между особями с крайними проявлениями признака.

При этом популяция становится генотипически и фенотипически более однородной (центростремительная сила дизассортативного скрещивания). Например: Низкое растение (aabb) x Высокое растение (AABB)→ Средние по высоте растения (AaBb).

В качестве другого примера можно привести скрещивание двух сортов, дополняющих один другой по некоторым признакам. Здесь также можно говорить об аутбридинге (А.В. Смиряев, 2003).

17.6: Ассортимент — Математика LibreTexts

Последнее обновление
Сохранить как PDF

Идентификатор страницы: 7876

Хироки Саяма
Бингемтонский университет, Университет штата Нью-Йорк через OpenSUNY

Градусы — это показатель, измеряемый на отдельных узлах. Но когда мы фокусируемся на ребрах, с каждым ребром всегда связаны две степени: одна для узла, откуда исходит ребро, а другая — для узла, на который указывает ребро. Таким образом, если мы возьмем первое значение для x, а второе — значение y для всех ребер в сети, мы сможем построить точечную диаграмму, которая визуализирует возможную степень корреляции между узлами на ребрах. Такие корреляции свойств узлов между ребрами можно в целом описать с помощью концепции ассортативности:

Ассортативность (положительная ассортативность) Склонность узлов соединяться с другими узлами с аналогичными свойствами в сети.
Дисассортативность (отрицательная ассортативность) Склонность узлов соединяться с другими узлами с отличающимися свойствами в сети.

Коэффициент ассортиментности

\[r =\frac{ \sum_{(i,j)\epsilon{E}}(f(i) -\bar{f} _{1})(f(j) -\bar{f}_ {2})}{ \sqrt{\sum_{(i,j)\epsilon{E}} (f(j) -\bar{f}_{2})} \sqrt{ \sum_{(i,j )\epsilon{E}} (f(j) -\bar{f}_{2})^{2}} } \label{(17. 33)} \]

, где \(E\) — множество направленных ребер (неориентированные ребра должны встречаться дважды в \(E\) в двух направлениях), а
\[\bar{f}_{1} =\frac{\sum_{ i,j}\epsilon{E} {f(i)}}{|E|}, \qquad \bar{f}_{2} =\frac{\sum_{i,j}\epsilon{E} f (к)}{|Е|}. \метка{(17.34)} \]

Коэффициент ассортативности — это коэффициент корреляции Пирсона некоторого свойства узла \(f\) между парами связанных узлов. Положительные коэффициенты означают ассортативность, а отрицательные — дисассортативность.

Если измеряемым свойством является степень узла (т. е. \(f = deg\)), это называется коэффициентом степени ассортативности . Для направленных сетей каждый из \(\bar{f}_1\) и \(\bar{f}_2\) может быть как входящим, так и исходящим, поэтому вы можете измерить четыре различных степени ассортативности: вход-вход , вход-выход , выход-вход и выход-выход .

Давайте рассмотрим пример. Вот как нарисовать график разброса градусов по градусам:

В этом примере мы рисуем диаграмму рассеяния градус-градус для сети Барабаси-Альберта с 1000 узлов. Для каждого ребра градусы двух его концов хранятся в xdata и ydata дважды в разном порядке, потому что ненаправленное ребро можно считать в двух направлениях. Маркеры на графике сделаны прозрачными с помощью опции alpha , чтобы мы могли видеть изменения плотности на графике.

Результат показан на рис. 17.6.1, где каждая точка представляет одно направленное ребро в сети (так, неориентированное ребро представлено двумя точками, симметрично расположенными поперек диагональной зеркальной линии). Можно видеть, что большинство ребер соединяют узлы низкой степени друг с другом, при этом некоторые ребра соединяют узлы низкой степени и высокой степени, но довольно редко узлы высокой степени соединяются друг с другом. Таким образом, в этом случае имеется умеренная отрицательная корреляция степени.

Рисунок \(\PageIndex{1}\): Визуальный вывод кода 17.19.
Мы можем подтвердить это наблюдение, рассчитав коэффициент ассортативности степеней следующим образом:

Эта функция также имеет опции x (для \(\bar{f}_1\)) и y (для \(\bar{f}_2\)) для указания степени, которую вы используете при расчете коэффициентов для направленных сетей:

Существуют и другие функции, которые могут вычислять ассортативность свойств узлов, отличных от степеней. Ознакомьтесь с онлайн-документацией NetworkX для получения более подробной информации.

Упражнение \(\PageIndex{1}\)

Измерение коэффициента ассортативности степеней графа клуба карате. Объясните результат с учетом фактической топологии графа.

Известно, что реальные сети демонстрируют разнообразную ассортативность. В целом социальные сети человеческих индивидуумов, такие как отношения сотрудничества между учеными или корпоративными директорами, как правило, демонстрируют положительную ассортативность, в то время как технологические сети (энергетическая сеть, Интернет и т. д.) и биологические сети (взаимодействия белков, нейронные сети, пищевые сети) и др.), как правило, проявляют отрицательную ассортативность [76].

В то же время известно также, что безмасштабные сети конечного размера (которыми являются многие сети реального мира) естественным образом демонстрируют отрицательную дисассортативность исключительно из-за врожденных структурных ограничений, что называется структурным отсечением [25]. Такая диссортативность возникает из-за того, что просто недостаточно узловых узлов, доступных для подключения друг к другу для поддержания ассортативности. Это означает, что положительная ассортативность, обнаруженная в человеческих социальных сетях, указывает на то, что определенно существует какой-то ассортативный механизм, управляющий их самоорганизацией, в то время как отрицательная ассортативность, обнаруженная в технологических и биологических сетях, может быть объяснена этой простой структурной причиной. Чтобы определить, является ли сеть, демонстрирующая отрицательную ассортативность, фундаментально дисассортативной по неструктурным причинам, вам нужно будет провести контрольный эксперимент, рандомизировав ее топологию и измерив ассортативность при сохранении того же распределения степеней.

Упражнение \(\PageIndex{2}\)

Рандомизируйте топологию графа клуба карате, сохранив его последовательность степеней, а затем измерьте коэффициент ассортативности степеней рандомизированного графа. Повторите это много раз, чтобы получить распределение коэффициентов для рандомизированных графиков. Затем сравните распределение с фактической ассортативностью исходного графа клуба карате. Основываясь на результате, определите, является ли граф клуба каратэ действительно ассортативным или дисассортативным.

Эта страница под названием 17.6: Assortativity распространяется под лицензией CC BY-NC-SA 3.0 и была создана, изменена и/или курирована Хироки Саямой (OpenSUNY) с помощью исходного контента, который был отредактирован в соответствии со стилем и стандартами Платформа LibreTexts; подробная история редактирования доступна по запросу.

Наверх

Была ли эта статья полезной?

Тип изделия

Раздел или Страница

Автор

Хироки Саяма

Лицензия

CC BY-NC-SA

Версия лицензии

3,0

Показать страницу TOC

нет
Теги
1. source@https://milneopentextbooks. org/introduction-to-the-modeling-and-analysis-of-complex-systems

8 Ассортимент и сходство | Справочник по графам и сетям в HR-аналитике

В этой главе мы завершим изучение важных концепций и метрик графов, рассмотрев две новые концепции, которые аналитики HR-сетей часто имеют веские причины для изучения. Первая концепция — это ассортативность, и она описывается как склонность вершин соединяться или «прикрепляться» к вершинам с аналогичными свойствами в графе. Это фактически мера гомофилии в сети. Высокоассортативные сети более устойчивы к деструктивным событиям, таким как потеря вершин, но из-за своей концентрации они могут быть неэффективными с точки зрения потока информации, а в организационных условиях они могут быть проблематичными для разнообразного взаимодействия и опыта.

Второе понятие, которое мы рассмотрим, — сходство вершин и графов. В некоторых сетях, где информация о свойствах вершин недоступна, может иметь смысл сделать вывод, что две вершины чем-то похожи, если их непосредственные сети очень похожи. Понятие сходства также можно распространить на целые графы. В простейшем случае мы можем рассматривать один и тот же набор вершин, но использовать разные определения соединения, и нам нужна мера того, создают ли эти разные определения по существу одну и ту же сеть или совершенно другую сеть. По мере того, как организации начинают анализировать множество различных форм данных для определения соединения (электронная почта, календарь, расписание, совместная работа над документами и многие другие), становится все более и более важным понимать сходства или различия между сетями, генерируемыми этими источниками данных.

8.1 Ассортимент в сетях

Мы уже видели в предыдущих главах, что естественно хотеть изучить степень, в которой вершины с подобными свойствами истинности основания более плотно связаны в графе. В главе 7 мы рассмотрели, как политики, представляющие одни и те же политические партии, общаются друг с другом через Twitter или как школьники из одного класса общаются через Facebook. В упражнениях в конце этой главы мы рассмотрели, как сообщества исследователей формируются по электронной почте либо внутри, либо между отделами по исследованию наземных исследований.

Коэффициент ассортативности графа является мерой степени, в которой вершины с одинаковыми свойствами связаны друг с другом. Это относительно недавно определенная метрика, и она определяется немного по-разному в зависимости от того, является ли интересующее свойство категориальным (например, отдел или политическая партия) или числовым (например, степень центральности). Полное описание и математическое определение см. в Newman (2002).

Коэффициент ассортативности графа находится в диапазоне от \(-1\) до \(1\), как и коэффициент корреляции. Коэффициенты ассортативности, близкие к \(1\), указывают на очень высокую вероятность соединения двух вершин с одинаковым свойством. это называется Ассортиментная сеть . Коэффициенты ассортативности, близкие к \(-1\), указывают на очень низкую вероятность того, что две вершины с одним и тем же свойством будут соединены. Это называется дисассортативной сетью . Сети с коэффициентами ассортативности, близкими к нулю, не являются ни ассортативными, ни дисассортативными и обычно описываются как имеющие нейтральную ассортативность .

8.1.1 Категориальная или номинальная ассортативность

Давайте сначала рассмотрим категориальную ассортативность, вернувшись к двум примерам из предыдущей главы. Во-первых, мы смотрим на нашу сеть школьных друзей в Facebook и вычисляем ассортативность по классам. В R мы можем использовать assortativity_nominal() функция для вычисления категориальной ассортативности (о реализации Python см. в конце этой главы). Обратите внимание, что эти функции ожидают, что числовой вектор укажет на принадлежность к категории.

 библиотека (играф)
# получить данные
schoolfriends_edgelist <- read.csv(
  "https://ona-book.org/data/schoolfriends_edgelist.csv"
)
schoolfriends_vertices <- read.csv(
  "https://ona-book.org/data/schoolfriends_vertices. csv"
)
# создать неориентированный граф дружбы в Facebook
schoolfriends_fb <- igraph::graph_from_data_frame(
  d = schoolfriends_edgelist |>
    dplyr::filter(type == "facebook"),
  вершины = школьные_вершины,
  направленный = ЛОЖЬ
)
# рассчитать ассортативность по классам для дружбы в Facebook
igraph::assortativity_nominal(
  школьные друзья_фб,
  as.integer (as.factor (V (schoolfriends_fb) $ class))
)

 ## [1] 0,3833667

Это предполагает умеренную ассортативность или умеренную вероятность того, что учащиеся одного класса будут друзьями на Facebook. Теперь давайте сравним с «настоящей» дружбой.

 # создать ориентированный граф заявленных дружеских отношений
школьные друзья_rp <- igraph::graph_from_data_frame(
  d = schoolfriends_edgelist |>
    dplyr::filter(type == "сообщено"),
  вершины = школьные_вершины
)
# рассчитать ассортативность по классам для заявленных дружеских отношений
igraph::assortativity_nominal(
  школьные друзья_рп,
  as.integer (as.factor (V (schoolfriends_fb) $ class))
)

 ## [1] 0,7188919

Мы наблюдаем значительно более высокую ассортативность по классам для заявленных дружеских отношений, что указывает на то, что пребывание в одном классе более тесно связано с развитием заявленной школьной дружбы.

Поиграем: Возможно, вы помните понятие модульности, которое мы ввели в главе 7. Для категориальных свойств вершин модульность и ассортативность эффективно измеряют сходные понятия. Рассчитайте модульность для школьных друзей Facebook по классам и сравните ее с ассортативностью. Кроме того, поиграйте с некоторыми предыдущими наборами данных и рассчитайте ассортативность некоторых сообществ, которые мы обнаружили в главе 7. Вспомните также наш пример из главы 5, где мы разделили workfrance население, чтобы иметь столы с хорошим сочетанием разных отделов. Если вы выполнили это упражнение, вам может быть интересно сравнить ассортативность этой совокупности по отделам и по таблицам, чтобы оценить, насколько успешно вы создали разнообразные таблицы.

8.1.2 Ассортимент степеней

Наиболее распространенной формой числовой ассортативности является ассортативность по степеням. Ассортативность высокой степени является мерой преимущественной привязанности в организациях, где вершины с высокой степенью связаны друг с другом, а большое количество вершин с низкой степенью составляют оставшуюся часть сети.

Опять же, давайте используем наши школьных друзей сетей в качестве примера для расчета степени ассортативности в рупиях. igraph::assortativity_degree(schoolfriends_fb)

 ## [1] 0.02462444

 # степень ассортативности зарегистрированных дружеских отношений (направленных)
igraph::assortativity_degree(schoolfriends_rp)

 ## [1] 0,3098123

Мы видим, что реальная дружба в этих данных умеренно ассортативна, тогда как дружба в Facebook примерно нейтральна. Это указывает на то, что более популярные студенты имеют более сильную тенденцию в реальной жизни дружить с другими популярными студентами.

Хотя это относительно новая концепция, ассортативность является полезной мерой для понимания людей или организационных сетей. Высокоассортативные сети демонстрируют устойчивость в том, что знания, сообщество и другой социальный капитал сконцентрированы в сильном ядре, а сбои, такие как уход участников из этих сетей, с меньшей вероятностью повлияют на сеть в целом. Однако такие сети также демонстрируют характеристики, которые контрпродуктивны для разнообразия и инклюзивности, и могут представлять собой сложную среду для адаптации новых участников.

Считалось, что социальные сети отличаются от большинства других реальных сетей тем, что они сортируют по степени. Однако недавние исследования начали ставить это под сомнение. Хотя кажется, что социальные сети более ассортативны, чем несоциальные сети, исследования различных наборов данных, в которых связь между людьми является прямой (а не выведенной из совместного членства в группе), показывают, что социальные сети, вероятно, нейтральны. ассортативным (Fisher et al. (2017)). Это тема исследования, представляющая большой интерес в настоящее время в области анализа социальных сетей.

8.2 Сходство вершин

Часто нам не повезло иметь действительно богатую наземную информацию о вершинах сети. Это особенно актуально, если нам нужно проанализировать сети людей в условиях ограничений анонимности. Тем не менее, как мы видели на примерах в предыдущих главах, таких как граф workfrance и граф ontariopol , вычислительные методы позволяют нам делать выводы о вершинах и группах вершин, которые часто могут быть хорошими оценками свойств истинности этих вершин. вершины. В некоторых сетях мы можем заключить, что вершины в чем-то похожи, если они имеют очень похожие непосредственные соединения. Например, в нашей workfrance , если две вершины имеют сети первой степени, которые в значительной степени перекрываются, было бы разумно сделать вывод о вероятности того, что эти две вершины принадлежат одному и тому же отделу.

Коэффициент сходства вершин пары вершин является мерой того, насколько похожи непосредственные сети этих двух вершин. Представьте, что у нас есть две вершины \(v_1\) и \(v_2\) в невзвешенном графе \(G\). Существует три распространенных способа вычисления сходства вершин \(v_1\) и \(v_2\):

Коэффициент сходства Жаккара – это число вершин, являющихся соседями как \(v_1\), так и \(v_2\), деленное на количество вершин, являющихся соседями хотя бы одной из \( v_1\) и \(v_2\).
Коэффициент подобия игральных костей равен удвоенному числу вершин, являющихся соседями как \(v_1\), так и \(v_2\), деленному на сумму степеней центральности \(v_1\) и \(v_2\ ). Таким образом, в этом методе общие соседи учитываются дважды.
Обратный логарифмически взвешенный коэффициент подобия представляет собой сумму обратных логарифмов степеней общих соседей \(v_1\) и \(v_2\). Это определение утверждает, что общие соседи, имеющие высокий уровень в сети, «менее ценны» при обнаружении подобия, потому что существует более высокая вероятность того, что они просто случайно окажутся общими соседями.

Чтобы проиллюстрировать эти три типа коэффициентов сходства вершин и показать, как они вычисляются в R, давайте вернемся к нашему невзвешенному графу \(G_{14}\) из глав 5 и 6 и снова визуализируем его на рис. 8.1.

 библиотека (играф)
библиотека (ggraph)
библиотека (dplyr)
# загрузить список краев и создать невзвешенный график
g14_edgelist <- read. csv("https://ona-book.org/data/g14_edgelist.csv")
g14 <- igraph::graph_from_data_frame(d = g14_edgelist |>
                                       dplyr::select(от, до),
                                     направленный = ЛОЖЬ)
# визуализировать
сет.сид(123)
(g14viz <- ggraph(g14, layout = "lgl") +
    geom_edge_link (цвет = "серый") +
    geom_node_label (aes (метка = имя), fill = "голубой") +
    тема_void())

Рисунок 8.1: Это снова наш старый друг \(G_{14}\)

Давайте посмотрим на вершины 7 и 8 в \(G_{14}\). Чтобы вычислить коэффициент сходства Жаккара, заметим, что вершины 4 и 9 являются двумя общими соседями этих вершин, и что все вершины 4, 6, 7, 8 и 9 являются соседями по крайней мере одной из вершин 7 и 8. Следовательно, мы должны увидеть коэффициент подобия Жаккара 0,4. Мы используем функцию подобие() в igraph , которая по умолчанию вычисляет сходство Жаккара.

 igraph::similarity(g14, vids = c("7", "8"))

 ## [1] [2]
## [1,] 1,0 0,4
## [2,] 0,4 1,0

Мы видим в недиагональных компонентах этой матрицы подтверждение коэффициента подобия Жаккара, равного 0,4.

Для расчета коэффициента сходства костей заметим, что сумма степеней вершин 7 и 8 равна 7; следовательно, подобие костей должно быть равно \(\frac{4}{7}\) или 0,571.

 igraph::similarity(g14, vids = c("7", "8"), method = "dice")

 ## [1] [2]
## [1,] 1.0000000 0.5714286
## [2,] 0.5714286 1.0000000

Наконец, чтобы вычислить обратный логарифмически взвешенный коэффициент подобия, мы суммируем обратное значение логарифмов степеней общих соседей вершин 4 и 8, что равно \(\frac{1} {\ln{7}} + \frac{1}{\ln{4}}\), что соответствует 1,235.

Вывод этого варианта функции подобие() возвращает сходство выбранных вершин со всеми вершинами в сети — попробуйте, если хотите. Чтобы извлечь конкретное сходство для вершин 7 и 8, мы должны убедиться, что строки и столбцы матрицы помечены именем вершины, прежде чем извлекать из нее конкретное значение.

 # получить взвешенное сходство invlog
invsim <- igraph::similarity(g14, method = "invlogweighted")
# строки и столбцы должны быть помечены именем вершины перед извлечением
имена столбцов (invsim) <- V (g14) $ имя
имена строк (invsim) <- V (g14) $ имя
# извлечь значение для вершин 7 и 8
invsim["7", "8"]

 ## [1] 1. 235246

Игра вокруг: Вернемся к некоторым из наших предыдущих примеров из главы 7, где мы обнаружили сообщества более плотно связанных вершин в графах, таких как школьные друзья и онтариополь . Поэкспериментируйте с вычислением сходства между парами вершин внутри сообществ и между сообществами и подумайте, имеют ли результаты смысл.

8.3 Сходство графов

Общий вопрос о том, демонстрируют ли два графа, которые содержат вершины, представляющие разные объекты, одинаковые внутренние закономерности и структуры, представляет большой интерес для информатики и распознавания изображений. Изоморфизм графа 9Например, задача 0053 — это вычислительная задача, связанная с поиском функции, которая точно отображает вершины одного графа на другие ⁷⁴ .

При анализе организационной сети нас обычно больше интересует сравнение графов, в которых вершины представляют одни и те же объекты (обычно людей), а набор вершин идентичен, но набор ребер может отличаться. Примером этого является наш набор данных школьных друзей из ранее в этой главе, где вершины представляют собой одно и то же множество старшеклассников, но где наборы ребер различаются в зависимости от того, является ли дружба дружбой на Facebook или зарегистрированной дружбой. В этой ситуации мы можем использовать общую метрику сходства множеств из теории множеств, чтобы определить, насколько похожи наши графики.

Пусть \(G_1 = (V, E_1)\) и \(G_2 = (V, E_2)\) — два графа с одинаковым набором вершин. Подобие Жаккара из \(G_1\) и \(G_2\) равно количеству ребер в как \(E_1\), так и \(E_2\), деленному на количество ребер в по крайней мере одного из \(E_1\) и \(E_2\).

Обратите внимание, что сходство Жаккара, равное 1, означает, что оба графа имеют идентичные наборы ребер и, следовательно, идентичны по структуре, а сходство, равное 0, означает, что оба графа не имеют общих ребер. Давайте попробуем это на нашем школьных друзей граф. Чтобы провести справедливое сравнение, мы переопределим наш граф школьных друзей на Facebook, чтобы он стал ориентированным графом, в котором ребра всегда идут в обоих направлениях.

# создать направленную версию графа Facebook schoolfriends_fb_dir <- igraph::as.directed(schoolfriends_fb)

Мы можем создать удобную функцию для вычисления сходства Жаккара наборов ребер двух графов. Обратите внимание, что в пакете igraph есть специальные операторы %s% для пересечения двух графов (то есть всех вершин и ребер, которые являются общими для обоих графов), и %u% для объединения двух графов (то есть все уникальные вершины и ребра в обоих графах вместе взятые).

# функция для подобия жаккардовых наборов ребер jaccard_edgeset_similarity <- функция (G1, G2) { промежуточный <- длина (E (G1 %s% G2)) un <- длина (E (G1 %u% G2)) если (ип == 0) { 0 } еще { интер/оон } } # тест jaccard_edgeset_similarity(schoolfriends_fb_dir, schoolfriends_rp)

## [1] 0,09727385

Мы видим, что сходство между дружбой на Facebook и «настоящей» дружбой составляет всего около 10%.

8.4 Вычисление ассортативности и подобия в Python

Чтобы продемонстрировать функции ассортативности, мы загружаем наборы данных школьных друзей .

импортировать networkx как nx импортировать панд как pd # загрузить данные # получить данные schoolfriends_edgelist = pd.read_csv( "https://ona-book.org/data/schoolfriends_edgelist.csv" ) школьные друзья_вертикали = pd.read_csv( "https://ona-book.org/data/schoolfriends_vertices.csv" ) # создать неориентированный граф facebook школьные друзья_fb = nx.from_pandas_edgelist( df = школьные друзья_список_краев[ schoolfriends_edgelist.type == 'facebook' ], источник = "от", цель = "до" ) # создать ориентированный отчетный граф школьные друзья_rp = nx.from_pandas_edgelist( df = школьные друзья_список_краев[ schoolfriends_edgelist.type == 'сообщено' ], источник = "от", цель = "до", create_using=nx.DiGraph() ) # добавить атрибут вершины класса к обоим графикам class_attr = dict (zip (schoolfriends_vertices ['id'], schoolfriends_vertices['класс'])) nx. set_node_attributes (schoolfriends_fb, имя = "класс", значения = class_attr) nx.set_node_attributes (schoolfriends_rp, имя = "класс", значения = class_attr)

Следующие функции можно использовать для расчета категориальной ассортативности и степенной ассортативности соответственно.

nx.attribute_assortativity_coefficient(schoolfriends_fb, "class")

## 0.3833666875368265

nx.attribute_assortativity_coefficient(schoolfriends_rp, "class")

## 0.7188918572576617

nx.degree_assortativity_coefficient(schoolfriends_fb)

## 0.024624435635859483

nx .степень_ассортативности_коэффициент (школьные друзья_рп)

## 0.30981226480406543

Чтобы вычислить сходство Жаккара между двумя вершинами, мы можем использовать функцию jaccard_coefficient() в networkx . В этом примере мы вычисляем коэффициенты Жаккара для двух пар вершин в schoolfriends_fb .

жаккардов = nx.жаккард_коэффициент (G = школьные_фб, ebunch = [(883, 132), (63, 991)]) отсортировано (жаккарды)

## [(63, 991, 0,15384615384615385), (883, 132, 0,30612244897959184)]

Коэффициенты подобия игральных костей и обратные логарифмически взвешенные коэффициенты подобия могут быть рассчитаны путем создания функций.

# функция сходства игральных костей def dice_coefficient(G, ebunch = None): Def dicesim(u, v): общая_степень = nx.степень(G, u) + nx.степень(G, v) если общая_степень == 0: вернуть 0 вернуть 2*len(список(nx.common_neighbors(G, u, v))) / total_степень если ebunch равен None: ebunch = nx.non_edges(G) return ((u, v, dicesim(u, v)) для u, v в ebunch) # тест dice = dice_coefficient(G = schoolfriends_fb, ebunch = [(883, 132), (63, 991)]) sorted(dice)

## [(63, 991, 0.26666666666666666), (883, 132, 0.46875)]

import math # функция для обратного логарифмически взвешенного подобия def invlogweight_coefficient (G, ebunch = None): определение invlogwsim(u, v): logw = [1/math. log(nx.степень(G, w)) для w в nx.common_neighbors(G, u, v)] если logw == 0: вернуть 0 возвращаемая сумма (i для i в logw) если ebunch равен None: ebunch = nx.non_edges(G) return ((u, v, invlogwsim(u, v)) для u, v в ebunch) # тест invlogw = invlogweight_coefficient(G = schoolfriends_fb, ebunch = [(883, 132), (63, 991)]) sorted(invlogw)

## [(63, 991, 0.5728002621049868), (883, 132, 4.566433503199232)]

Наконец, для вычисления сходства по Жаккару двух наборов ребер можно написать простую функцию:

# create function для подобия набора ребер Жаккара определение jaccard_edgeset_similarity (G1, G2): setG1 = набор (G1.ребра) пересечение = len(setG1.intersection(G2.edges)) объединение = len(setG1.union(G2.edges)) если союз == 0: вернуть 0 возврат пересечения/объединения # воссоздать schoolfriends_fb как направленный граф для сравнения школьные друзья_fb_dir = школьные друзья_fb. to_directed() # тест jaccard_edgeset_similarity (schoolfriends_fb_dir, schoolfriends_rp)

## 0,09727385377942999

8.5 Учебные упражнения

8.5.2 Упражнения с данными

Рассчитайте коэффициент гендерной ассортативности в двух графах школьных друзей . Что бы вы из этого сделали?

Рассчитайте коэффициент ассортативности отдела на графике workfrance из предыдущих глав.

Рассчитайте коэффициент ассортативности степеней workfrance и Онтариополь графики из предыдущих глав. Как бы вы описали смысл разницы между ними?

Выберите пары вершин из одного отдела в графе workfrance и рассчитайте их коэффициенты сходства Жаккара. Затем выберите пары из разных отделов и сделайте то же самое. Имеют ли результаты смысл? Почему?

Найдите три вершины с наивысшей степенью центральности в графе workfrance и рассчитайте для них некоторые попарные коэффициенты сходства.