WikiSort.ru - Программирование

ПОИСК ПО САЙТУ | о проекте

Полуопределённое программирование (en: Semidefinite programming, SDP) — это подраздел выпуклого программирования^[en], которое занимается оптимизацией линейной целевой функции (целевая функция — это заданная пользователем функция, значение которой пользователь хочет минимизировать или максимизировать) на пересечении конусов положительно полуопределённых матриц с аффинным пространством.

Полуопределённое программирование является относительно новой областью оптимизации, интерес к которой растёт по нескольким причинам. Много практических задач в областях исследования операций и комбинаторной оптимизации можно смоделировать или аппроксимировать как задачи полуопределённого программирования. В теории автоматического управления задачи SDP используются в контексте линейных матричных неравенств. Задачи SDP, фактически, являются частным случаем конического программирования^[en] и могут быть эффективно решены методом внутренней точки. Все задачи линейного программирования могут быть выражены как задачи SDP, а с помощью иерархий задач SDP могут быть аппроксимированы решения задач полиномиальной оптимизации. Полуопределённое программирование используется при оптимизации сложных систем. В последние годы некоторые задачи сложности квантовых запросов были сформулированы в терминах полуопределённого программирования.

Мотивация и определение

Исходные мотивации

Задача линейного программирования — это задача, в которой нужно максимизировать или минимизировать линейную целевую функцию от вещественных переменных на многограннике. В полуопределённом программировании, вместо этого мы используем вещественные вектора и нам позволено использовать скалярное произведение векторов. Условие неотрицательности вещественных переменных задачи ЛП заменяется ограничениями полуопределённости на матрице переменных задачи SDP. В частности, общая задача полуопределённого программирования может быть определена как любая задача математического программирования вида

{\min _{x^{1},\ldots ,x^{n}\in \mathbb {R} ^{n}}}{\sum _{i,j\in [n]}c_{i,j}(x^{i}\cdot x^{j})}

при условиях

{\sum _{i,j\in [n]}a_{i,j,k}(x^{i}\cdot x^{j})\leq b_{k}\qquad \forall k}.

Эквивалентные формулировки

Говорят, что $n\times n$ матрица $M$ положительно полуопределённа, если она является матрицей Грама некоторых векторов (т.е. если существуют вектора $x^{1},\ldots ,x^{n}$ , такие, что $m_{i,j}=x^{i}\cdot x^{j}$ для всех $i,j$ ). Если это выполняется, мы обозначим это как $M\succeq 0$ . Заметим, что существуют некоторые другие эквивалентные определения положительной полуопределённости, например, положительно полуопределённые матрицы имеют только неотрицательные собственные значения и имеет положительно полуопределённый квадратный корень.

Обозначим через $\mathbb {S} ^{n}$ пространство всех $n\times n$ вещественных симметричных матриц. В этом пространстве имеется скалярное произведение $\langle A,B\rangle _{\mathbb {S} ^{n}}={\rm {tr}}(A^{T}B)=\sum _{i=1,j=1}^{n}A_{ij}B_{ij}.$ (где ${\rm {tr}}$ означает след)

Мы можем переписать задачу математического программирования из предыдущей секции в эквивалентном виде

{\min _{X\in \mathbb {S} ^{n}}}\langle C,X\rangle _{\mathbb {S} ^{n}}

при условиях

{\begin{array}{ll}{\displaystyle \langle A_{k},X\rangle _{\mathbb {S} ^{n}}\leq b_{k},\quad k=1,\ldots ,m}\\X\succeq 0\end{array}}

где элемент $i,j$ матрицы $C$ равно $c_{i,j}$ из предыдущей секции, а $A_{k}$ — $n\times n$ матрица, имеющая в качестве элемента $i,j$ матрицы значение $a_{i,j,k}$ из предыдущей секции.

Заметим, что если мы добавим дополнительные переменные^[en] должным образом, эта задача SDP может быть преобразована к виду

\min _{X\in \mathbb {S} ^{n}}}\langle C,X\rangle _{\mathbb {S} ^{n}

при условиях

{\begin{array}{ll}\langle A_{k},X\rangle _{\mathbb {S} ^{n}}=b_{k},\quad k=1,\ldots ,m\\X\succeq 0\end{array}}

Для удобства задача SDP может быть определена слегка в другой, но эквивалентной форме. Например, линейные выражения, использующие неотрицательные скалярные переменные могут быть добавлены в спецификацию задачи. Задача остаётся SDP, поскольку каждая переменная может быть включена в матрицу $X$ как диагональный элемент ( $X_{ii}$ для некоторого $i$ ). Чтобы обеспечить $X_{ii}\geq 0$ , можно добавить ограничения $X_{ij}=0$ для всех $j\neq i$ . В качестве другого примера, заметим, что для любой положительной полуопределённой матрицы $X$ , существует набор векторов $\{v_{i}\}$ , таких, что элемент $i$ , $j$ матрицы $X$ равен $X_{ij}=(v_{i},v_{j})$ , скалярному произведению векторов $v_{i}$ и $v_{j}$ . Таким образом, задачи SDP часто формулируются в терминах линейных выражений от скалярных произведений векторов. Если дано решение задачи SDP в стандартном виде, вектора $\{v_{i}\}$ могут быть восстановлены за время $O(n^{3})$ (например, с помощью неполного разложения Холецкого матрицы X).

Теория двойственности

Определения

Аналогично линейному программированию, если задана общая задача SDP в виде

\min _{X\in \mathbb {S} ^{n}}\langle C,X\rangle _{\mathbb {S} ^{n}}

при условиях

{\begin{array}{ll}\langle A_{i},X\rangle _{\mathbb {S} ^{n}}=b_{i},\quad i=1,\ldots ,m\\X\succeq 0\end{array}}

(прямая задача, или P-SDP), мы определим двойственную полуопределённую задачу (D-SDP) как

\max _{y\in \mathbb {R} ^{m}}\langle b,y\rangle _{\mathbb {R} ^{m}}

при условиях

{\begin{array}{ll}{\displaystyle \sum _{i=1}^{m}}y_{i}A_{i}\preceq C\end{array}}

Где для любых двух матриц $P$ и $Q$ , $P\succeq Q$ означает $P-Q\succeq 0$ .

Слабая двойственность

Теорема о слабой двойственности^[en] утверждает, что прямая задача SDP имеет значение, не меньшее значения двойственной SDP. Таким образом, любое допустимое решение двойственной задачи SDP ограничивает снизу значение прямой SDP, и наоборот, любое допустимое значение прямой задачи SDP ограничивает сверху значение двойственной SDP. Это происходит потому, что

\langle C,X\rangle -\langle b,y\rangle =\langle C,X\rangle -\sum _{i=1}^{m}y_{i}b_{i}=\langle C,X\rangle -\sum _{i=1}^{m}y_{i}\langle A_{i},X\rangle =\langle C-\sum _{i=1}^{m}y_{i}A_{i},X\rangle \geq 0,

где последнее неравенство отражает факт положительной полуопределённости обеих матриц. Значение этой функции иногда называется двойственным зазором.

Сильная двойственность

При условии, известном как условие Слейтера^[en], значения прямой и двойственной SDP-задач равны. Это называется сильной двойственностью^[en]. В отличие от задач линейного программирования, не всякая задача SDP обладает строгой двойственностью. В общем случае значение двойственной задачи SDP может быть строго меньше значения прямой задачи.

(i) Предположим, что прямая задача (P-SDP) ограничена снизу и строго допустима (то есть существуют $X_{0}\in \mathbb {S} ^{n},X_{0}\succ 0$ , такие, что $\langle A_{i},X_{0}\rangle _{\mathbb {S} ^{n}}=b_{i}$ , $i=1,\ldots ,m$ ). Тогда имеется оптимальное решение $y^{*}$ для двойственной задачи (D-SDP) и

\langle C,X^{*}\rangle _{\mathbb {S} ^{n}}=\langle b,y^{*}\rangle _{\mathbb {R} ^{m}}.

(ii) Предположим, что двойственная задача (D-SDP) ограничена сверху и строго допустима (то есть $\sum _{i=1}^{m}(y_{0})_{i}A_{i}\prec C$ для некоторого $y_{0}\in \mathbb {R} ^{m}$ ). Тогда существует оптимальное решение $X^{*}$ для прямой задачи (P-SDP) и выполняется равенство из (i).

Примеры

Пример 1

Рассмотрим три случайные переменные $A$ , $B$ и $C$ . По определениию, их коэффициенты корреляции $\rho _{AB},\ \rho _{AC},\rho _{BC}$ допустимы тогда и только тогда, когда

{\begin{pmatrix}1&\rho _{AB}&\rho _{AC}\\\rho _{AB}&1&\rho _{BC}\\\rho _{AC}&\rho _{BC}&1\end{pmatrix}}\succeq 0

Предположим, что из каких-то источников (например, из эмпирических или экспериментальных данных) мы знаем, что $-0,2\leq \rho _{AB}\leq -0,1$ и $0,4\leq \rho _{BC}\leq 0,5$ . Задачу определения наименьшего и наибольшего значений $\rho _{AC}\$ можно выписать в виде:

минимизировать/максимизировать

x_{13}

при условиях

-0,2\leq x_{12}\leq -0,1

0,4\leq x_{23}\leq 0,5

x_{11}=x_{22}=x_{33}=1\

{\begin{pmatrix}1&x_{12}&x_{13}\\x_{12}&1&x_{23}\\x_{13}&x_{23}&1\end{pmatrix}}\succeq 0

Здесь мы принимаем $\rho _{AB}=x_{12},\ \rho _{AC}=x_{13},\ \rho _{BC}=x_{23}$ . Задачу можно сформулировать как задачу SDP. Мы дополняем неравенства путём расширения матрицы переменных и введения дополнительных переменных^[en], например

$\mathrm {tr} \left(\left({\begin{array}{cccccc}0&1&0&0&0&0\\0&0&0&0&0&0\\0&0&0&0&0&0\\0&0&0&1&0&0\\0&0&0&0&0&0\\0&0&0&0&0&0\end{array}}\right)\cdot \left({\begin{array}{cccccc}1&x_{12}&x_{13}&0&0&0\\x_{12}&1&x_{23}&0&0&0\\x_{13}&x_{23}&1&0&0&0\\0&0&0&s_{1}&0&0\\0&0&0&0&s_{2}&0\\0&0&0&0&0&s_{3}\end{array}}\right)\right)=x_{12}+s_{1}=-0,1$

После решения этой задачи SDP получим минимум и максимум значений $\rho _{AC}=x_{13}\$ ( $-0,978$ и $0,872$ соответственно).

Пример 2

Рассмотрим задачу

минимизировать

{\frac {(c^{T}x)^{2}}{d^{T}x}}

при условиях

Ax+b\geq 0

,

где предполагается, что $d^{T}x>0$ при $Ax+b\geq 0$ .

Введя дополнительную переменную $t$ , перепишем задачу в виде:

минимизировать

t

при условиях

Ax+b\geq 0,\,{\frac {(c^{T}x)^{2}}{d^{T}x}}\leq t

В этой формулировке целевая функция является линейной функцией от двух переменных ( $x,t$ ).

Первое ограничение можно переписать в виде

{\textbf {diag}}(Ax+b)\geq 0

,

где матрица ${\textbf {diag}}(Ax+b)$ является квадратной матрицей со значениями на диагонали, равными элементам вектора $Ax+b$ .

Второе ограничение можно записать в виде

td^{T}x-(c^{T}x)^{2}\geq 0

Определим матрицу $D$ следующим образом

D=\left[{\begin{array}{cc}t&c^{T}x\\c^{T}x&d^{T}x\end{array}}\right]

Мы можем использовать теорию дополнения Шура, чтобы показать, что

D\succeq 0

^[1]

Задача полуоределённого программирования для этой задачи будет иметь вид

минимизировать

t

при условиях

\left[{\begin{array}{ccc}{\textbf {diag}}(Ax+b)&0&0\\0&t&c^{T}x\\0&c^{T}x&d^{T}x\end{array}}\right]\succeq 0

Пример 3 (Аппроксимационный алгоритм Гоеманса — Уильямсона MAX CUT)

Полуопределённое программирование является важным инструментом для создания аппроксимационных алгоритмов для NP-трудных задач максимизации. Первый аппроксимационный алгоритм, основанный на SDP, предложили Михель Гоеманс и Дэвид Уильямсон^[2]. Они изучали задачу MAX CUT: Дан граф G = (V, E), требуется разбить вершины V на две части так, чтобы максимизировать число рёбер соединяющих эти две части. Задачу можно представить как задачу целочисленного квадратичного программирования:

Максимизировать

\sum _{(i,j)\in E}{\frac {1-v_{i}v_{j}}{2}},

при условии

v_{i}\in \{1,-1\}

для любого

i

.

Если только не P = NP, мы не можем решить эту задачу эффективно. Однако Гоеманс и Уильямсон наметили трёхшаговую процедуру для атаки такого рода задач:

Ослабляем целочисленную задачу квадратичного программирования до задачи SDP.
Решаем задачу SDP (с любой произвольно малой ошибкой $\epsilon$ ).
Округляем решение задачи SDP для получения приближённого решения исходной задачи целочисленного квадратичного программирования.

Для задачи MAX CUT наиболее естественным ослаблением является

\max \sum _{(i,j)\in E}{\frac {1-\langle v_{i},v_{j}\rangle }{2}},

для

\lVert v_{i}\rVert ^{2}=1

, где максимизация осуществляется по векторам

\{v_{i}\}

, а не скалярным целым переменным.

Задача является задачей SDP, поскольку и целевая функция, и ограничения являются линейными функциями от скалярных произведений векторов. Решение задачи SDP даёт набор единичных векторов в $\mathbf {R^{n}}$ . Поскольку вектора не обязательно коллинеарны, значение ослабленной задачи может быть только больше значения исходной целочисленной задачи квадратичного программирования. Конечная процедура округления необходима, чтобы получить разбиение. Гоеманс и Уильямсон выбирают случайную гиперплоскость (используя равномерное распределение), проходящую через начало координат и разбивают вершины в зависимости от расположения относительно этой плоскости. Непосредственный анализ показывает, что эта процедура обеспечивает ожидаемый аппроксимационный коэффициент 0,87856 - ε. (Математическое ожидание значения разреза равно сумме по всем рёбрам вероятностей, что ребро входит в разрез и это ожидание пропорционально углу $\cos ^{-1}\langle v_{i},v_{j}\rangle$ между векторами в конечных вершинах ребра. Если сравнивать эту вероятность с $(1-\langle v_{i},v_{j}\rangle )/{2}$ , математическое ожидание отношения всегда будет не меньшим 0,87856.) В предположении верности гипотезы уникальной игры^[en] можно показать, что аппроксимационный коэффициент этой аппроксимации, главным образом, оптимален.

Со времени появления статья Гоеманса и Уильямсона задачи SDP были применены для разработки большого количества аппроксимационных алгоритмов. Не так давно Прасад Рагхавендра разработал общую схему для задач удовлетворения ограничений, основанную на гипотезе уникальной игры^[en]^[3].

Алгоритмы

Имеется несколько видов алгоритмов для решения задач SDP. Результат работы этих алгоритмов является значение задачи SDP с точностью до $\epsilon$ , которое получается за время, полиномиально зависящее от размера задачи и $\log(1/\epsilon )$ .

Методы внутренней точки

Большинство систем решения базируются на методе внутренней точки (CSDP, SeDuMi, SDPT3, DSDP, SDPA), робастном и эффективном для линейных задач SDP общего вида. Подход ограничен в использовании тем фактом, что алгоритмы являются методами второго порядка и требуют запоминания и разложения больших (и, зачастую, плотных) матриц.

Методы первого порядка

Методы первого порядка для конической оптимизации^[en] избегают запоминания и разложения больших матриц Гессе и применимы к существенно большим по размеру задачам, чем методы внутренней точки, за счёт потери в точности. Метод реализован в системе «SCS solver».

Метод пучков

Задача SDP формулируется как задача негладкой оптимизации и решается методом спектрального пучка. Этот подход очень эффективен для частных классов линейных задач SDP.

Другие

Алгоритмы, основанные на методе обобщённого лагранжиана^[en] (PENSDP), близки по поведению к методам внутренней точки и могут быть приспособлены для некоторых очень больших задач. Другие алгоритмы используют низкоуровневую информацию и переформулировку задачи SDP как задачи нелинейного программирования (SPDLR).

Приложения

Полуопределённое программирование были использовано для поиска приближённых решений задач комбинаторной оптимизации, таких как решение задачи максимального разреза c аппроксимационным коэффициентом 0,87856. Задачи SDP используется также в геометрии для определения тенсегрити-графов, и появляются в теории управления как линейные матричные неравенства.

Примечания

Литература

Lieven Vandenberghe, Stephen Boyd. Semidefinite Programming // SIAM Review 38. — 1996. — Март. — С. 49–95.
Monique Laurent, Franz Rendl. Semidefinite Programming and Integer Programming/Report PNA-R0210, CWI, Amsterdam. — 2002. — Апрель.
E. de Klerk. Aspects of Semidefinite Programming: Interior Point Algorithms and Selected Applications. — Kluwer Academic Publishers, 2002. — ISBN 1-4020-0547-4.
P. Raghavendra. Optimal algorithms and inapproximability results for every CSP? // Proceedings of the 40th Annual ACM Symposium on theory of Computing (Victoria, British Columbia, Canada, May 17–20, 2008). STOC '08.. — New York, NY: ACM, 2008. — С. 245-254.
Robert M. Freund. Introduction to Semidefinite Programming (SDP).
Michel X. Goemans, David P. Williamson. Improved approximation algorithms for maximum cut and satisfiability problems using semidefinite programming // JACM. — 1995. — Ноябрь (т. 42, вып. 6). — С. 1115-1145. — DOI:10.1145/227683.227684.

Ссылки

Links to introductions and events in the field
Lecture notes from László Lovász on Semidefinite Programming

Данная страница на сайте WikiSort.ru содержит текст со страницы сайта "Википедия".

Если Вы хотите её отредактировать, то можете сделать это на странице редактирования в Википедии.

Если сделанные Вами правки не будут кем-нибудь удалены, то через несколько дней они появятся на сайте WikiSort.ru .

Текст в блоке "Читать" взят с сайта "Википедия" и доступен по лицензии Creative Commons Attribution-ShareAlike; в отдельных случаях могут действовать дополнительные условия.

Другой контент может иметь иную лицензию. Перед использованием материалов сайта WikiSort.ru внимательно изучите правила лицензирования конкретных элементов наполнения сайта.

2019-2026
WikiSort.ru - проект по пересортировке и дополнению контента Википедии

[_162bc15258a75db1-1] Boyd, Vandenberghe, 1996.

[_b080f6af060b873c-2] Goemans, Williamson, 1995.

[_9d3498cfa14339ff-3] Raghavendra, 2008, с. 245-254.

Методы оптимизации
Одномерные	Метод золотого сечения Дихотомия Метод парабол Перебор по сетке Метод равномерного блочного поиска Метод Фибоначчи Троичный поиск Метод Пиявского Метод Стронгина
Прямые методы	Метод Гаусса Метод Нелдера — Мида Метод Хука — Дживса Метод конфигураций Метод Розенброка
Первого порядка	Градиентный спуск Метод Зойтендейка Покоординатный спуск Метод сопряжённых градиентов Квазиньютоновские методы Алгоритм Левенберга — Марквардта
Второго порядка	Метод Ньютона Метод Ньютона — Рафсона Алгоритм Бройдена — Флетчера — Гольдфарба — Шанно (BFGS)
Стохастические	Метод Монте-Карло Имитация отжига Эволюционные алгоритмы Дифференциальная эволюция Муравьиный алгоритм Метод роя частиц Алгоритм пчелиной колонии Метод случайных блужданий
Методы линейного программирования	Симплекс-метод Алгоритм Гомори Метод эллипсоидов Метод потенциалов
Методы нелинейного программирования	Последовательное квадратичное программирование