cgs

求解线性系统 - 共轭梯度二乘法

全页折叠

语法

x = cgs(A,b)

x = cgs(A,b,tol)

x = cgs(A,b,tol,maxit)

x = cgs(A,b,tol,maxit,M)

x = cgs(A,b,tol,maxit,M1,M2)

x = cgs(A,b,tol,maxit,M1,M2,x0)

[x,flag] = cgs(___)

[x,flag,relres] = cgs(___)

[x,flag,relres,iter] = cgs(___)

[x,flag,relres,iter,resvec] = cgs(___)

说明

x = cgs(A,b) 尝试使用共轭梯度二乘法求解关于 x 的线性系统 A*x = b。如果尝试成功，cgs 会显示一条消息来确认收敛。如果 cgs 无法在达到最大迭代次数后收敛或出于任何原因暂停，则会显示一条包含相对残差 norm(b-A*x)/norm(b) 以及该方法停止时的迭代序号的诊断消息。

x = cgs(A,b,tol) 指定该方法的容差。默认容差是 1e-6。

x = cgs(A,b,tol,maxit) 指定要使用的最大迭代次数。如果 cgs 无法在 maxit 次迭代内收敛，将显示诊断消息。

示例

x = cgs(A,b,tol,maxit,M) 指定预条件子矩阵 M 并通过有效求解关于 y 的方程组 $A M^{- 1} y = b$ 来计算 x，其中 $y = M x$ 。使用预条件子矩阵可以改善问题的数值属性和计算的效率。

示例

x = cgs(A,b,tol,maxit,M1,M2) 指定预条件子矩阵 M 的因子，使得 M = M1*M2。

x = cgs(A,b,tol,maxit,M1,M2,x0) 指定解向量 x 的初始估计值。默认值为由零组成的向量。

示例

[x,flag] = cgs(___) 返回一个标志，指示算法是否成功收敛。当 flag = 0 时，收敛成功。您可以将此输出语法用于之前的任何输入参量组合。如果指定了 flag 输出，cgs 将不会显示任何诊断消息。

示例

[x,flag,relres] = cgs(___) 还会返回相对残差 norm(b-A*x)/norm(b)。如果 flag 为 0，则 relres <= tol。

示例

[x,flag,relres,iter] = cgs(___) 还会返回计算出 x 时的迭代序号 iter。

示例

[x,flag,relres,iter,resvec] = cgs(___) 还会在每次迭代中返回残差范数向量（包括第一个残差 norm(b-A*x0)）。

示例

全部折叠

线性系统的迭代解

打开实时脚本

使用采用默认设置的 cgs 求解系数矩阵为方阵的线性系统，然后在求解过程中调整使用的容差和迭代次数。

创建密度为 50% 的随机稀疏矩阵 A。另为 $Ax = b$ 的右侧创建随机向量。

rng default
A = sprand(600,600,.5);
A = A'*A + speye(size(A));
b = rand(600,1);

使用 cgs 求解 $Ax = b$ 。输出显示包括相对残差 $\frac{‖ b - Ax ‖}{‖ b ‖}$ 的值。

x = cgs(A,b);

cgs stopped at iteration 20 without converging to the desired tolerance 1e-06
because the maximum number of iterations was reached.
The iterate returned (number 20) has relative residual 0.068.

默认情况下，cgs 使用 20 次迭代和容差 1e-6，对于此矩阵，算法无法在 20 次迭代后收敛。由于残差仍然很大，这说明需要更多的迭代（或预条件子矩阵）。您也可以使用更大的容差，使算法更容易收敛。

使用容差 1e-4 和 40 次迭代再次求解方程组。

x = cgs(A,b,1e-4,40);

cgs stopped at iteration 40 without converging to the desired tolerance 0.0001
because the maximum number of iterations was reached.
The iterate returned (number 40) has relative residual 0.0024.

即使有更宽松的容差和更多迭代，cgs 也不会收敛。当迭代算法以这种方式停滞时，显然需要预条件子矩阵。

计算 A 的不完全乔列斯基分解，并使用 L 因子作为 cgs 的预条件子输入。

L = ichol(A);
x = cgs(A,b,1e-4,40,L);

cgs converged at iteration 13 to a solution with relative residual 7.3e-05.

使用预条件子可以充分改进问题的数值属性，使 cgs 能够收敛。

使用指定了预条件子的 `cgs`

打开实时脚本

检查使用指定了预条件子矩阵的 cgs 来求解线性系统的效果。

加载 west0479，它是一个非对称的 479×479 实稀疏矩阵。

load west0479
A = west0479;

定义 b 以使 $Ax = b$ 的实际解是全为 1 的向量。

b = sum(A,2);

设置容差和最大迭代次数。

tol = 1e-12;
maxit = 20;

使用 cgs 根据请求的容差和迭代次数求解。指定五个输出以返回有关求解过程的信息：

x 是计算 A*x = b 所得的解。
fl0 是指示算法是否收敛的标志。
rr0 是计算的解 x 的相对残差。
it0 是计算 x 时所用的迭代序号。
rv0 是 $‖ b - Ax ‖$ 的残差历史记录组成的向量。

[x,fl0,rr0,it0,rv0] = cgs(A,b,tol,maxit);
fl0

fl0 = 1

rr0

rr0 = 1

it0

it0 = 0

cgs 未在请求的 20 次迭代内收敛至请求的容差 1e-12，因此 fl0 为 1。实际上，cgs 的行为太差，因此初始估计值 x0 = zeros(size(A,2),1) 是最佳解，并会返回最佳解（如 it0 = 0 所示）。

为了有助于缓慢收敛，您可以指定预条件子矩阵。由于 A 是非对称的，请使用 ilu 生成预条件子 $M = L U$ 。指定调降容差，以忽略值小于 1e-6 的非对角线元。通过指定 L 和 U 作为 cgs 的输入，求解预条件方程组 ${A M}^{- 1} M x = b$ 。

setup = struct('type','ilutp','droptol',1e-6);
[L,U] = ilu(A,setup);
[x1,fl1,rr1,it1,rv1] = cgs(A,b,tol,maxit,L,U);
fl1

fl1 = 0

rr1

rr1 = 4.3851e-14

it1

it1 = 3

在第三次迭代中，使用 ilu 预条件子产生的相对残差小于规定的容差 1e-12。输出 rv1(1) 为 norm(b)，输出 rv1(end) 为 norm(b-A*x1)。

您可以通过绘制每次迭代的相对残差来跟踪 cgs 的进度。绘制每个解的残差历史记录图，并添加一条表示指定容差的线。

semilogy(0:length(rv0)-1,rv0/norm(b),'-o')
hold on
semilogy(0:length(rv1)-1,rv1/norm(b),'-o')
yline(tol,'r--');
legend('No preconditioner','ILU preconditioner','Tolerance','Location','East')
xlabel('Iteration number')
ylabel('Relative residual')

提供初始估计值

打开实时脚本

检查向 cgs 提供解的初始估计值的效果。

创建一个三对角稀疏矩阵。使用每行的总和作为 $Ax = b$ 右侧的向量，使 $x$ 的预期解是由 1 组成的向量。

n = 900;
e = ones(n,1);
A = spdiags([e 2*e e],-1:1,n,n);
b = sum(A,2);

使用 cgs 求解 $Ax = b$ 两次：一次是使用默认的初始估计值，一次是使用解的良好初始估计值。对两次求解均使用 200 次迭代和默认容差。将第二种求解中的初始估计值指定为所有元素都等于 0.99 的向量。

maxit = 200;
x1 = cgs(A,b,[],maxit);

cgs converged at iteration 17 to a solution with relative residual 8.8e-07.

x0 = 0.99*e;
x2 = cgs(A,b,[],maxit,[],[],x0);

cgs converged at iteration 4 to a solution with relative residual 8e-07.

在这种情况下，提供初始估计值可以使 cgs 更快地收敛。

返回中间结果

您还可以通过在 for 循环中调用 cgs 来使用初始估计值获得中间结果。每次调用求解器都会执行几次迭代，并存储计算出的解。然后，将该解用作下一批迭代的初始向量。

例如，以下代码会循环执行四次，每次执行 100 次迭代，并在 for 循环中每通过一次后均存储解向量：

x0 = zeros(size(A,2),1);
tol = 1e-8;
maxit = 100;
for k = 1:4
    [x,flag,relres] = cgs(A,b,tol,maxit,[],[],x0);
    X(:,k) = x;
    R(k) = relres;
    x0 = x;
end

X(:,k) 是在 for 循环的第 k 次迭代时计算的解向量，R(k) 是该解的相对残差。

使用函数句柄代替数值矩阵

打开实时脚本

通过为 cgs 提供用来计算 A*x 的函数句柄（而非系数矩阵 A）来求解线性系统。

gallery 生成的威尔金森测试矩阵之一是 21×21 三对角矩阵。预览该矩阵。

A = gallery('wilk',21)

A = 21×21

    10     1     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     1     9     1     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     1     8     1     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     1     7     1     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     1     6     1     0     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     1     5     1     0     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     1     4     1     0     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     1     3     1     0     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     0     1     2     1     0     0     0     0     0     0     0     0     0     0     0
     0     0     0     0     0     0     0     0     1     1     1     0     0     0     0     0     0     0     0     0     0
      ⋮

威尔金森矩阵有特殊的结构，因此您可以用函数句柄来表示 A*x 运算。当 A 乘以向量时，所得向量中的大多数元素为零。结果中的非零元素对应于 A 的非零三对角元素。此外，只有主对角线具有不等于 1 的非零值。

表达式 $Ax$ 变为：

$Ax = [\begin{array}{c} 10 & 1 & 0 & \dots & \dots & \dots & 0 & 0 \\ 1 & 9 & 1 & 0 & 0 \\ 0 & 1 & 8 & 1 & 0 & ⋮ \\ ⋮ & 0 & 1 & 7 & 1 & 0 \\ 0 & 1 & 6 & 1 & 0 & ⋮ \\ ⋮ & 0 & 1 & 5 & 1 & 0 \\ 0 & 1 & 4 & 1 & 0 & ⋮ \\ ⋮ & 0 & 1 & 3 & ⋱ & 0 \\ 0 & 0 & ⋱ & ⋱ & 1 \\ 0 & 0 & \dots & \dots & \dots & 0 & 1 & 10 \end{array}] [\begin{array}{c} x_{1} \\ x_{2} \\ x_{3} \\ x_{4} \\ x_{5} \\ ⋮ \\ ⋮ \\ x_{21} \end{array}] = [\begin{array}{c} 10 x_{1} + x_{2} \\ x_{1} + 9 x_{2} + x_{3} \\ x_{2} + 8 x_{3} + x_{4} \\ ⋮ \\ x_{19} + 9 x_{20} + x_{21} \\ x_{20} + 10 x_{21} \end{array}]$ .

结果向量可以写为三个向量的和：

$Ax = [\begin{array}{c} 0 + 10 x_{1} + x_{2} \\ x_{1} + 9 x_{2} + x_{3} \\ x_{2} + 8 x_{3} + x_{4} \\ ⋮ \\ x_{19} + 9 x_{20} + x_{21} \\ x_{20} + 10 x_{21} + 0 \end{array}]$ = $[\begin{array}{c} 0 \\ x_{1} \\ ⋮ \\ x_{20} \end{array}] + [\begin{array}{c} 10 x_{1} \\ 9 x_{2} \\ ⋮ \\ 10 x_{21} \end{array}] + [\begin{array}{c} x_{2} \\ ⋮ \\ x_{21} \\ 0 \end{array}]$ 。

在 MATLAB® 中，编写一个函数来创建这些向量并将它们相加，从而给出 A*x 的值：

function y = afun(x)
y = [0; x(1:20)] + ...
    [(10:-1:0)'; (1:10)'].*x + ...
    [x(2:21); 0];
end

（该函数作为局部函数保存在示例的末尾。）

现在，通过为 cgs 提供用于计算 A*x 的函数句柄，求解线性系统 $Ax = b$ 。使用容差 1e-12 和 50 次迭代。

b = ones(21,1);
tol = 1e-12;  
maxit = 50;
x1 = cgs(@afun,b,tol,maxit)

cgs converged at iteration 11 to a solution with relative residual 1.3e-14.

检查 afun(x1) 是否产生由 1 组成的向量。

afun(x1)

局部函数

function y = afun(x)
y = [0; x(1:20)] + ...
    [(10:-1:0)'; (1:10)'].*x + ...
    [x(2:21); 0];
end

输入参数

全部折叠

`A` — 系数矩阵
矩阵 | 函数句柄

系数矩阵，指定为方阵或函数句柄。该矩阵是线性系统 A*x = b 中的系数矩阵。通常，A 是大型稀疏矩阵或函数句柄，它返回大型稀疏矩阵和列向量的乘积。

将 `A` 指定为函数句柄

您可以选择将系数矩阵指定为函数句柄而不是矩阵。函数句柄返回矩阵向量乘积，而不是构建整个系数矩阵，从而使计算更加高效。

要使用函数句柄，请使用函数签名 function y = afun(x)。参数化函数说明如何在必要时为函数 afun 提供附加参数。函数调用 afun(x) 必须返回 A*x 的值。

数据类型: double | function_handle
复数支持: 是

`b` — 线性方程的右侧
列向量

线性方程的右侧，指定为列向量。b 的长度必须等于 size(A,1)。

数据类型: double
复数支持: 是

`tol` — 方法容差
`[]` 或 `1e-6` (默认) | 正标量

方法容差，指定为正标量。计算中使用此输入可在准确度和运行时间之间进行权衡。cgs 必须在允许的迭代次数内满足容差才能成功。较小的 tol 值意味着解必须更精确才能成功完成计算。

数据类型: double

`maxit` — 最大迭代次数
`[]` 或 `min(size(A,1),20)` (默认) | 正整数标量

最大迭代次数，指定为正整数标量。增加 maxit 的值，以允许 cgs 进行更多迭代，从而满足容差 tol。通常，较小的 tol 值意味着需要更多迭代才能成功完成计算。

`M`, `M1`, `M2` — 预条件子矩阵（以单独参量指定）
`eye(size(A))` (默认) | 矩阵 | 函数句柄

预条件子矩阵，指定为由矩阵或函数句柄组成的单独参量。您可以指定预条件子矩阵 M 或其矩阵因子 M = M1*M2 来改进线性系统的数值方面，使 cgs 更容易快速收敛。您可以使用不完全矩阵分解函数 ilu 和 ichol 来生成预条件子矩阵。您还可以在分解之前使用 equilibrate 来改进系数矩阵的条件数。有关预条件子的详细信息，请参阅线性方程组的迭代方法。

cgs 将未指定的预条件子视为单位矩阵。

将 `M` 指定为函数句柄

您可以选择将 M、M1 或 M2 中的任一个指定为函数句柄而不是矩阵。函数句柄执行矩阵向量运算，而不是构建整个预条件子矩阵，从而使计算更加高效。

要使用函数句柄，请使用函数签名 function y = mfun(x)。参数化函数说明如何在必要时为函数 mfun 提供附加参数。函数调用 mfun(x) 必须返回 M\x 或 M2\(M1\x) 的值。

数据类型: double | function_handle
复数支持: 是

`x0` — 初始估计值
`[]` 或由零组成的列向量 (默认) | 列向量

初始估计值，指定为长度等于 size(A,2) 的列向量。如果您能为 cgs 提供比默认的零向量更合理的初始估计值 x0，则它可以节省计算时间并帮助算法更快地收敛。

数据类型: double
复数支持: 是

输出参量

全部折叠

`x` — 线性系统的解
列向量

线性系统的解，以列向量形式返回。该输出给出线性系统 A*x = b 的近似解。如果计算成功 (flag = 0)，则 relres 小于或等于 tol。

每当计算不成功 (flag ~= 0) 时，cgs 返回的解 x 是在所有迭代中计算出的残差范数最小的解。

`flag` — 收敛标志
标量

收敛标志，返回下表中的标量值之一。收敛标志指示计算是否成功，并区分几种不同形式的失败。

标志值	收敛
`0`	成功 - `cgs` 在 `maxit` 次迭代内收敛至所需容差 `tol`。
`1`	失败 - `cgs` 执行了 `maxit` 次迭代，但未收敛。
`2`	失败 - 预条件子矩阵 `M` 或 `M = M1*M2` 为病态。
`3`	失败 - `cgs` 在经过两次相同的连续迭代后已停滞。
`4`	失败 - 由 `cgs` 算法计算的标量数量之一变得太小或太大，无法继续计算。

`relres` — 相对残差
标量

相对残差，以标量形式返回。相对残差 relres = norm(b-A*x)/norm(b) 指示解的准确度。如果计算在 maxit 次迭代内收敛于容差 tol，则 relres <= tol。

数据类型: double

`iter` — 迭代序号
标量

迭代序号，以标量形式返回。此输出指示计算出 x 的解时所用的迭代序号。

数据类型: double

`resvec` — 残差
向量

残差，以向量形式返回。残差 norm(b-A*x) 揭示对于给定的 x 值，算法接近收敛的程度。resvec 中元素的数量等于迭代次数。您可以检查 resvec 的内容，以帮助决定是否更改 tol 或 maxit 的值。

数据类型: double

详细信息

全部折叠

共轭梯度二乘法

开发共轭梯度二乘 (CGS) 算法是为了改进双共轭梯度 (BiCG) 算法。CGS 算法不使用残差及其共轭，而是通过使用残差平方来避免使用系数矩阵的转置 [1]。

在计算成本相当的情况下，CGS 的收敛速度快于 BiCG，但可能具有不规则的收敛行为，尤其是当初始估计值接近解时 [1]。

提示

大多数迭代方法的收敛取决于系数矩阵的条件数 cond(A)。当 A 是方阵时，您可以使用 equilibrate 来改进其条件数，它本身就能使大多数迭代求解器更容易收敛。但如果您随后会对经平衡处理的矩阵 B = R*P*A*C 进行因式分解，使用 equilibrate 还可以获得质量更好的预条件子矩阵。
您可以使用矩阵重新排序函数（如 dissect 和 symrcm）来置换系数矩阵的行和列，并在系数矩阵被分解以生成预条件子时最小化非零值的数量。这可以减少后续求解预条件线性系统所需的内存和时间。

参考

[1] Barrett, R., M. Berry, T. F. Chan, et al., Templates for the Solution of Linear Systems: Building Blocks for Iterative Methods, SIAM, Philadelphia, 1994.

[2] Sonneveld, Peter, “CGS: A fast Lanczos-type solver for nonsymmetric linear systems,” SIAM J. Sci. Stat. Comput., January 1989, Vol. 10, No. 1, pp. 36–52.

扩展功能

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。

此函数完全支持基于线程的环境。有关详细信息，请参阅在基于线程的环境中运行 MATLAB 函数。

GPU 数组
通过使用 Parallel Computing Toolbox™ 在图形处理单元 (GPU) 上运行来加快代码执行。

用法说明和限制：

b 必须是非稀疏列向量。
当输入 A 是稀疏矩阵时：
- 仅支持一个稀疏矩阵预条件子 M。
- 如果使用两个预条件子 M1 和 M2，则它们都必须是函数。
- cgs 不检测停滞（标志 3）。此时，它会报告收敛失败（标志 1）。

有关详细信息，请参阅Run MATLAB Functions on a GPU (Parallel Computing Toolbox)。

分布式数组
使用 Parallel Computing Toolbox™ 在集群的组合内存中对大型数组进行分区。

用法说明和限制：

如果 M1 是函数，则它将独立应用于每行。

有关详细信息，请参阅Run MATLAB Functions with Distributed Arrays (Parallel Computing Toolbox)。

版本历史记录

在 R2006a 之前推出

另请参阅

主题

线性方程组的迭代方法

cgs

语法

说明

示例

线性系统的迭代解

使用指定了预条件子的 cgs

提供初始估计值

使用函数句柄代替数值矩阵

输入参数

A — 系数矩阵 矩阵 | 函数句柄

将 A 指定为函数句柄

b — 线性方程的右侧 列向量

tol — 方法容差 [] 或 1e-6 (默认) | 正标量

maxit — 最大迭代次数 [] 或 min(size(A,1),20) (默认) | 正整数标量

M, M1, M2 — 预条件子矩阵（以单独参量指定） eye(size(A)) (默认) | 矩阵 | 函数句柄

将 M 指定为函数句柄

x0 — 初始估计值 [] 或由零组成的列向量 (默认) | 列向量

输出参量

x — 线性系统的解 列向量

flag — 收敛标志 标量

relres — 相对残差 标量

iter — 迭代序号 标量

resvec — 残差 向量

详细信息

共轭梯度二乘法

提示

参考

扩展功能

基于线程的环境 使用 MATLAB® backgroundPool 在后台运行代码或使用 Parallel Computing Toolbox™ ThreadPool 加快代码运行速度。

GPU 数组 通过使用 Parallel Computing Toolbox™ 在图形处理单元 (GPU) 上运行来加快代码执行。

分布式数组 使用 Parallel Computing Toolbox™ 在集群的组合内存中对大型数组进行分区。

版本历史记录

另请参阅

主题

WeChat

使用指定了预条件子的 `cgs`

`A` — 系数矩阵
矩阵 | 函数句柄

将 `A` 指定为函数句柄

`b` — 线性方程的右侧
列向量

`tol` — 方法容差
`[]` 或 `1e-6` (默认) | 正标量

`maxit` — 最大迭代次数
`[]` 或 `min(size(A,1),20)` (默认) | 正整数标量

`M`, `M1`, `M2` — 预条件子矩阵（以单独参量指定）
`eye(size(A))` (默认) | 矩阵 | 函数句柄

将 `M` 指定为函数句柄

`x0` — 初始估计值
`[]` 或由零组成的列向量 (默认) | 列向量

`x` — 线性系统的解
列向量

`flag` — 收敛标志
标量

`relres` — 相对残差
标量

`iter` — 迭代序号
标量

`resvec` — 残差
向量

基于线程的环境
使用 MATLAB® `backgroundPool` 在后台运行代码或使用 Parallel Computing Toolbox™ `ThreadPool` 加快代码运行速度。

GPU 数组
通过使用 Parallel Computing Toolbox™ 在图形处理单元 (GPU) 上运行来加快代码执行。

分布式数组
使用 Parallel Computing Toolbox™ 在集群的组合内存中对大型数组进行分区。