Blame - y2014/control_loops/python/extended_lqr.py - RealtimeRoboticsGroup/test

2016-07-20 19:57:01 -0700

[diff] [blame]

302

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

303

S_bar_stiff = S_bar_1_eigh_eigenvectors * numpy.matrix(

304

numpy.diag(

305

S_bar_1_eigh_eigenvalues_stiff)) * S_bar_1_eigh_eigenvectors.T

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

306

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

307

print('Min u', -numpy.linalg.solve(TotalS_1, Totals_1))

308

print('Min x_hat', optimal_x_1)

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

309

s_bar_t[1] = -s_t[1] - (S_bar_stiff + S_t[1]) * optimal_x_1

310

s_scalar_bar_t[1] = 0.5 * (

311

optimal_u_1.T * TotalS_1 * optimal_u_1 - optimal_x_1.T *

312

(S_bar_stiff + S_t[1]) *

313

optimal_x_1) + optimal_u_1.T * Totals_1 - optimal_x_1.T * (

314

s_bar_t[1] + s_t[1]) - s_scalar_t[1] + Totals_scalar_1

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

315

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

316

print('optimal_u_1', optimal_u_1)

317

print('TotalS_1', TotalS_1)

318

print('Totals_1', Totals_1)

319

print('Totals_scalar_1', Totals_scalar_1)

320

print(

321

'overall cost 1', 0.5 * (optimal_u_1.T * TotalS_1 * optimal_u_1) +

322

optimal_u_1.T * Totals_1 + Totals_scalar_1)

323

print(

324

'overall cost 0', 0.5 * (x_hat_initial.T * S_t[0] * x_hat_initial) +

325

x_hat_initial.T * s_t[0] + s_scalar_t[0])

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

326

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

327

print('t forward 0')

328

print('x_hat_initial[ 0]: %s' % (x_hat_initial))

329

print('x_hat[%2d]: %s' % (0, x_hat.T))

330

print('x_hat_next[%2d]: %s' % (0, x_hat_next.T))

331

print('u[%2d]: %s' % (0, u_t.T))

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

332

print('L[ 0]: %s' % (L_t[0], )).replace('\n', '\n ')

333

print('l[ 0]: %s' % (l_t[0], )).replace('\n', '\n ')

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

334

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

335

print('A_t[%2d]: %s' % (0, start_A_t)).replace('\n', '\n ')

336

print('B_t[%2d]: %s' % (0, start_B_t)).replace('\n', '\n ')

337

print('c_t[%2d]: %s' % (0, start_c_t)).replace('\n', '\n ')

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

338

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

339

# TODO(austin): optimal_x_1 is x_hat

340

x_hat = -numpy.linalg.solve((S_t[1] + S_bar_stiff), (s_t[1] + s_bar_t[1]))

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

341

print('new xhat', x_hat)

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

342

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

343

S_bar_t[1] = S_bar_stiff

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

344

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

345

last_x_hat_t[1] = x_hat

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

346

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

347

for t in range(1, l):

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

348

print('t forward', t)

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

349

u_t = L_t[t] * x_hat + l_t[t]

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

350

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

351

x_hat_next = discrete_dynamics(x_hat, u_t)

352

A_bar_t = numerical_jacobian_x(inverse_discrete_dynamics, x_hat_next,

353

u_t)

354

B_bar_t = numerical_jacobian_u(inverse_discrete_dynamics, x_hat_next,

355

u_t)

356

c_bar_t = x_hat - A_bar_t * x_hat_next - B_bar_t * u_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

357

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

358

print('x_hat[%2d]: %s' % (t, x_hat.T))

359

print('x_hat_next[%2d]: %s' % (t, x_hat_next.T))

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

360

print('L[%2d]: %s' % (

361

t,

362

L_t[t],

363

)).replace('\n', '\n ')

364

print('l[%2d]: %s' % (

365

t,

366

l_t[t],

367

)).replace('\n', '\n ')

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

368

print('u[%2d]: %s' % (t, u_t.T))

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

369

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

370

print('A_bar_t[%2d]: %s' % (t, A_bar_t)).replace(

371

'\n', '\n ')

372

print('B_bar_t[%2d]: %s' % (t, B_bar_t)).replace(

373

'\n', '\n ')

374

print('c_bar_t[%2d]: %s' % (t, c_bar_t)).replace(

375

'\n', '\n ')

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

376

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

377

Q_t = numerical_jacobian_x_x(cost_fn_obj.cost, x_hat, u_t)

378

P_t = numerical_jacobian_x_u(cost_fn_obj.cost, x_hat, u_t)

379

R_t = numerical_jacobian_u_u(cost_fn_obj.cost, x_hat, u_t)

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

380

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

381

q_t = numerical_jacobian_x(cost_fn_obj.cost, x_hat,

382

u_t).T - Q_t * x_hat - P_t.T * u_t

383

r_t = numerical_jacobian_u(cost_fn_obj.cost, x_hat,

384

u_t).T - P_t * x_hat - R_t * u_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

385

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

386

q_scalar_t = cost_fn_obj.cost(x_hat, u_t) - 0.5 * (

387

x_hat.T * (Q_t * x_hat + P_t.T * u_t) + u_t.T *

388

(P_t * x_hat + R_t * u_t)) - x_hat.T * q_t - u_t.T * r_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

389

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

390

C_bar_t = B_bar_t.T * (S_bar_t[t] + Q_t) * A_bar_t + P_t * A_bar_t

391

D_bar_t = A_bar_t.T * (S_bar_t[t] + Q_t) * A_bar_t

392

E_bar_t = B_bar_t.T * (

393

S_bar_t[t] +

394

Q_t) * B_bar_t + R_t + P_t * B_bar_t + B_bar_t.T * P_t.T

395

d_bar_t = A_bar_t.T * (s_bar_t[t] + q_t) + A_bar_t.T * (S_bar_t[t] +

396

Q_t) * c_bar_t

397

e_bar_t = r_t + P_t * c_bar_t + B_bar_t.T * s_bar_t[t] + B_bar_t.T * (

398

S_bar_t[t] + Q_t) * c_bar_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

399

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

400

L_bar_t[t + 1] = -numpy.linalg.inv(E_bar_t) * C_bar_t

401

l_bar_t[t + 1] = -numpy.linalg.inv(E_bar_t) * e_bar_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

402

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

403

S_bar_t[t + 1] = D_bar_t + C_bar_t.T * L_bar_t[t + 1]

404

s_bar_t[t + 1] = d_bar_t + C_bar_t.T * l_bar_t[t + 1]

405

s_scalar_bar_t[t + 1] = -0.5 * e_bar_t.T * numpy.linalg.inv(

406

E_bar_t) * e_bar_t + 0.5 * c_bar_t.T * (

407

S_bar_t[t] + Q_t) * c_bar_t + c_bar_t.T * s_bar_t[

408

t] + c_bar_t.T * q_t + s_scalar_bar_t[t] + q_scalar_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

409

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

410

x_hat = -numpy.linalg.solve((S_t[t + 1] + S_bar_t[t + 1]),

411

(s_t[t + 1] + s_bar_t[t + 1]))

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

412

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

413

S_t[l] = cost_fn_obj.estimate_Q_final(x_hat)

414

s_t[l] = cost_fn_obj.estimate_q_final(x_hat)

415

x_hat = -numpy.linalg.inv(S_t[l] + S_bar_t[l]) * (s_t[l] + s_bar_t[l])

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

416

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

417

for t in reversed(range(l)):

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

418

print('t backward', t)

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

419

# TODO(austin): I don't think we can use L_t like this here.

420

# I think we are off by 1 somewhere...

421

u_t = L_bar_t[t + 1] * x_hat + l_bar_t[t + 1]

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

422

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

423

x_hat_prev = inverse_discrete_dynamics(x_hat, u_t)

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

424

print('x_hat[%2d]: %s' % (t, x_hat.T))

425

print('x_hat_prev[%2d]: %s' % (t, x_hat_prev.T))

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

426

print('L_bar[%2d]: %s' % (t + 1, L_bar_t[t + 1])).replace(

427

'\n', '\n ')

428

print('l_bar[%2d]: %s' % (t + 1, l_bar_t[t + 1])).replace(

429

'\n', '\n ')

Austin Schuh

2024-09-02 15:02:36 -0700

[diff] [blame^]

430

print('u[%2d]: %s' % (t, u_t.T))

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

431

# Now compute the linearized A, B, and C

432

# Start by doing it numerically, and then optimize.

433

A_t = numerical_jacobian_x(discrete_dynamics, x_hat_prev, u_t)

434

B_t = numerical_jacobian_u(discrete_dynamics, x_hat_prev, u_t)

435

c_t = x_hat - A_t * x_hat_prev - B_t * u_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

436

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

437

print('A_t[%2d]: %s' % (t, A_t)).replace('\n', '\n ')

438

print('B_t[%2d]: %s' % (t, B_t)).replace('\n', '\n ')

439

print('c_t[%2d]: %s' % (t, c_t)).replace('\n', '\n ')

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

440

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

441

Q_t = numerical_jacobian_x_x(cost_fn_obj.cost, x_hat_prev, u_t)

442

P_t = numerical_jacobian_x_u(cost_fn_obj.cost, x_hat_prev, u_t)

443

P_T_t = numerical_jacobian_u_x(cost_fn_obj.cost, x_hat_prev, u_t)

444

R_t = numerical_jacobian_u_u(cost_fn_obj.cost, x_hat_prev, u_t)

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

445

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

446

q_t = numerical_jacobian_x(cost_fn_obj.cost, x_hat_prev,

447

u_t).T - Q_t * x_hat_prev - P_T_t * u_t

448

r_t = numerical_jacobian_u(cost_fn_obj.cost, x_hat_prev,

449

u_t).T - P_t * x_hat_prev - R_t * u_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

450

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

451

q_scalar_t = cost_fn_obj.cost(x_hat_prev, u_t) - 0.5 * (

452

x_hat_prev.T * (Q_t * x_hat_prev + P_t.T * u_t) + u_t.T *

453

(P_t * x_hat_prev + R_t * u_t)) - x_hat_prev.T * q_t - u_t.T * r_t

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

454

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

455

C_t = P_t + B_t.T * S_t[t + 1] * A_t

456

D_t = Q_t + A_t.T * S_t[t + 1] * A_t

457

E_t = R_t + B_t.T * S_t[t + 1] * B_t

458

d_t = q_t + A_t.T * s_t[t + 1] + A_t.T * S_t[t + 1] * c_t

459

e_t = r_t + B_t.T * s_t[t + 1] + B_t.T * S_t[t + 1] * c_t

460

L_t[t] = -numpy.linalg.inv(E_t) * C_t

461

l_t[t] = -numpy.linalg.inv(E_t) * e_t

462

s_t[t] = d_t + C_t.T * l_t[t]

463

S_t[t] = D_t + C_t.T * L_t[t]

464

s_scalar_t[t] = q_scalar_t - 0.5 * e_t.T * numpy.linalg.inv(

465

E_t) * e_t + 0.5 * c_t.T * S_t[t + 1] * c_t + c_t.T * s_t[

466

t + 1] + s_scalar_t[t + 1]

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

467

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

468

x_hat = -numpy.linalg.solve((S_t[t] + S_bar_t[t]),

469

(s_t[t] + s_bar_t[t]))

470

if t == 0:

471

last_x_hat_t[t] = x_hat_initial

472

else:

473

last_x_hat_t[t] = x_hat

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

474

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

475

x_hat_t = [x_hat_initial]

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

476

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

477

pylab.figure('states %d' % a)

478

pylab.ion()

479

for dim in range(num_states):

480

pylab.plot(numpy.arange(len(last_x_hat_t)),

481

[x_hat_loop[dim, 0] for x_hat_loop in last_x_hat_t],

482

marker='o',

483

label='Xhat[%d]' % dim)

484

pylab.legend()

485

pylab.draw()

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

486

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

487

pylab.figure('xy %d' % a)

488

pylab.ion()

489

pylab.plot([x_hat_loop[0, 0] for x_hat_loop in last_x_hat_t],

490

[x_hat_loop[1, 0] for x_hat_loop in last_x_hat_t],

marker='o',

label='trajectory')

pylab.legend()

pylab.draw()

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

495

496

final_u_t = [numpy.matrix(numpy.zeros((num_inputs, 1))) for _ in range(l + 1)]

cost_to_go = []

cost_to_come = []

cost = []

for t in range(l):

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

501

cost_to_go.append((0.5 * last_x_hat_t[t].T * S_t[t] * last_x_hat_t[t] +

502

last_x_hat_t[t].T * s_t[t] + s_scalar_t[t])[0, 0])

503

cost_to_come.append(

504

(0.5 * last_x_hat_t[t].T * S_bar_t[t] * last_x_hat_t[t] +

505

last_x_hat_t[t].T * s_bar_t[t] + s_scalar_bar_t[t])[0, 0])

506

cost.append(cost_to_go[-1] + cost_to_come[-1])

507

final_u_t[t] = L_t[t] * last_x_hat_t[t] + l_t[t]

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

508

509

for t in range(l):

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

510

A_t = numerical_jacobian_x(discrete_dynamics, last_x_hat_t[t],

511

final_u_t[t])

512

B_t = numerical_jacobian_u(discrete_dynamics, last_x_hat_t[t],

513

final_u_t[t])

514

c_t = discrete_dynamics(

515

last_x_hat_t[t],

516

final_u_t[t]) - A_t * last_x_hat_t[t] - B_t * final_u_t[t]

517

print("Infeasability at", t, "is",

518

((A_t * last_x_hat_t[t] + B_t * final_u_t[t] + c_t) -

519

last_x_hat_t[t + 1]).T)

Austin Schuh

2016-07-20 19:57:01 -0700

[diff] [blame]

520

521

pylab.figure('u')

522

samples = numpy.arange(len(final_u_t))

523

for i in range(num_inputs):

Ravago Jones

2022-07-31 16:32:45 -0700

[diff] [blame]

524

pylab.plot(samples, [u[i, 0] for u in final_u_t],

525

label='u[%d]' % i,

526

marker='o')

527

pylab.legend()

Austin Schuh