Switch to silu activation function SAC with experience paper says this works better for continuous action spaces. Lets do it! Change-Id: I78ddd38b87e5600efb82d50cd2923e8a4fb58fde Signed-off-by: Austin Schuh <austin.linux@gmail.com>

commit: 837ca922e51c9ff9d2beba1b746c280777f5cfa6 [log] [tgz]
author: Austin Schuh <austin.linux@gmail.com> Sat Oct 26 16:55:05 2024 -0700
committer: Austin Schuh <austin.linux@gmail.com> Sat Oct 26 21:50:31 2024 -0700
tree: c3d356ad8ee7692d97528534944508b10ce981f6
parent: ce95d87db7f1251e5dfd7cbc6f09947f8add946c [diff]
diff --git a/frc971/control_loops/swerve/velocity_controller/model.py b/frc971/control_loops/swerve/velocity_controller/model.py
index 9d5c5bc..6aa3e47 100644
--- a/frc971/control_loops/swerve/velocity_controller/model.py
+++ b/frc971/control_loops/swerve/velocity_controller/model.py

@@ -409,12 +409,12 @@
 def create_train_state(rng: PRNGKey, problem: Problem, q_learning_rate,
                        pi_learning_rate, alpha_learning_rate):
     """Creates initial `TrainState`."""
-    pi = SquashedGaussianMLPActor(activation=nn.activation.gelu,
+    pi = SquashedGaussianMLPActor(activation=nn.activation.silu,
                                   action_space=problem.num_outputs,
                                   action_limit=problem.action_limit)
     # We want q1 and q2 to have different network architectures so they pick up differnet things.
-    q1 = MLPQFunction(activation=nn.activation.gelu, hidden_sizes=[128, 256])
-    q2 = MLPQFunction(activation=nn.activation.gelu, hidden_sizes=[256, 128])
+    q1 = MLPQFunction(activation=nn.activation.silu, hidden_sizes=[128, 256])
+    q2 = MLPQFunction(activation=nn.activation.silu, hidden_sizes=[256, 128])
 
     @jax.jit
     def init_params(rng):
commit	837ca922e51c9ff9d2beba1b746c280777f5cfa6	[log] [tgz]
author	Austin Schuh <austin.linux@gmail.com>	Sat Oct 26 16:55:05 2024 -0700
committer	Austin Schuh <austin.linux@gmail.com>	Sat Oct 26 21:50:31 2024 -0700
tree	c3d356ad8ee7692d97528534944508b10ce981f6
parent	ce95d87db7f1251e5dfd7cbc6f09947f8add946c [diff]