חזרה: מרחב וקטורי, העתקות לינאריות ומטריצת מעבר
הרצאה 2 — חזרה מלינארית 1
הרצאה שנייה בקורס מוקדשת לחזרה על מרחב וקטורי, תת־מרחב, העתקות לינאריות, גרעין ותמונה, מטריצה מייצגת ומטריצת מעבר. החומר חיוני להמשך הקורס (ערכים עצמיים, דמיון מטריצות, צורת ז'ורדן).
מרחב וקטורי
מרחב וקטורי מעל שדה F F F הוא קבוצה V V V עם שתי פעולות:
חיבור V × V → V V \times V \to V V × V → V
כפל בסקלר F × V → V F \times V \to V F × V → V
המקיימות את האקסיומות הבאות:
חיבור (קבוצה אבלית):
קומוטטיביות: u + v = v + u u + v = v + u u + v = v + u
אסוציאטיביות: ( u + v ) + w = u + ( v + w ) (u + v) + w = u + (v + w) ( u + v ) + w = u + ( v + w )
קיום אפס: קיים 0 V ∈ V 0_V \in V 0 V ∈ V כך ש-v + 0 V = v v + 0_V = v v + 0 V = v
קיום נגדי: לכל v v v קיים − v -v − v כך ש-v + ( − v ) = 0 V v + (-v) = 0_V v + ( − v ) = 0 V
כפל בסקלר:
5. אסוציאטיביות: α ( β v ) = ( α β ) v \alpha(\beta v) = (\alpha\beta) v α ( β v ) = ( α β ) v
6. יחידה: 1 F ⋅ v = v 1_F \cdot v = v 1 F ⋅ v = v
קשר בין הפעולות (דיסטריבוטיביות):
7. α ( u + v ) = α u + α v \alpha(u + v) = \alpha u + \alpha v α ( u + v ) = αu + αv
8. ( α + β ) v = α v + β v (\alpha + \beta) v = \alpha v + \beta v ( α + β ) v = αv + β v
אינטואיציה
מרחב וקטורי הוא מקום שבו אפשר לעשות "אלגברה רגילה" עם וקטורים בלי לשבור חוקים.
הבחנה — שדה מול מרחב וקטורי
שדה = הסקלרים עצמם (R , Q , C \mathbb{R}, \mathbb{Q}, \mathbb{C} R , Q , C ). יש בו חיבור וכפל פנימי.
מרחב וקטורי = וקטורים שעליהם הסקלרים פועלים.
מימד הוא תכונה של מרחב וקטורי, לא של שדה.
תת־מרחב
קבוצה U ⊆ V U \subseteq V U ⊆ V היא תת־מרחב של V V V אם:
0 V ∈ U 0_V \in U 0 V ∈ U
U U U סגורה לחיבור: u 1 , u 2 ∈ U ⇒ u 1 + u 2 ∈ U u_1, u_2 \in U \Rightarrow u_1 + u_2 \in U u 1 , u 2 ∈ U ⇒ u 1 + u 2 ∈ U
U U U סגורה לכפל בסקלר: α ∈ F , u ∈ U ⇒ α u ∈ U \alpha \in F, u \in U \Rightarrow \alpha u \in U α ∈ F , u ∈ U ⇒ αu ∈ U
ניסוח מקוצר שימושי
מספיק לבדוק סגירות לצירוף לינארי : α u + β v ∈ U \alpha u + \beta v \in U αu + β v ∈ U לכל u , v ∈ U u, v \in U u , v ∈ U ו-α , β ∈ F \alpha, \beta \in F α , β ∈ F .
תכונה
כל תת־מרחב הוא בעצמו מרחב וקטורי, עם אותן פעולות (בצמצום).
העתקה לינארית
יהיו V , W V, W V , W מ"ו מעל שדה F F F . פונקציה T : V → W T: V \to W T : V → W נקראת העתקה לינארית (ה"ל / ט.ל.) אם מתקיימים שני התנאים:
אדיטיביות: T ( u + v ) = T ( u ) + T ( v ) T(u + v) = T(u) + T(v) T ( u + v ) = T ( u ) + T ( v )
הומוגניות: T ( α v ) = α T ( v ) T(\alpha v) = \alpha T(v) T ( αv ) = α T ( v )
הגדרה שקולה (שימור צירוף לינארי):
T ( α u + β v ) = α T ( u ) + β T ( v ) T(\alpha u + \beta v) = \alpha T(u) + \beta T(v) T ( αu + β v ) = α T ( u ) + βT ( v )
כלומר העתקה לינארית שומרת צירופים לינאריים .
תכונות:
T ( 0 V ) = 0 W T(0_V) = 0_W T ( 0 V ) = 0 W
אם T ( 0 ) ≠ 0 T(0) \neq 0 T ( 0 ) = 0 → T T T אינה ה"ל
T ( − v ) = − T ( v ) T(-v) = -T(v) T ( − v ) = − T ( v )
T ( α 1 v 1 + ⋯ + α n v n ) = α 1 T ( v 1 ) + ⋯ + α n T ( v n ) T(\alpha_1 v_1 + \cdots + \alpha_n v_n) = \alpha_1 T(v_1) + \cdots + \alpha_n T(v_n) T ( α 1 v 1 + ⋯ + α n v n ) = α 1 T ( v 1 ) + ⋯ + α n T ( v n )
T T T נקבעת לגמרי על ידי ערכיה על בסיס
אופרטור לינארי: אם W = V W = V W = V אז T : V → V T: V \to V T : V → V נקרא אופרטור לינארי .
גרעין ותמונה
יהי T : V → W T: V \to W T : V → W ה"ל.
גרעין (Kernel):
ker ( T ) = { v ∈ V ∣ T ( v ) = 0 W } ⊆ V \ker(T) = \{ v \in V \mid T(v) = 0_W \} \subseteq V ker ( T ) = { v ∈ V ∣ T ( v ) = 0 W } ⊆ V
תמונה (Image):
Im ( T ) = { T ( v ) ∣ v ∈ V } ⊆ W \text{Im}(T) = \{ T(v) \mid v \in V \} \subseteq W Im ( T ) = { T ( v ) ∣ v ∈ V } ⊆ W
ker T \ker T ker T הוא תת־מרחב של V V V , Im ( T ) \text{Im}(T) Im ( T ) הוא תת־מרחב של W W W .
אינטואיציה
גרעין = מה שנמחק (וקטורים שנשלחים לאפס)
תמונה = מה שנוצר/נשאר (כל מה שאפשר להגיע אליו)
תובנה חשובה — וקטורים עם אותו פלט
אם T ( v 1 ) = T ( v 2 ) T(v_1) = T(v_2) T ( v 1 ) = T ( v 2 ) , אז:
T ( v 1 − v 2 ) = T ( v 1 ) − T ( v 2 ) = 0 T(v_1 - v_2) = T(v_1) - T(v_2) = 0 T ( v 1 − v 2 ) = T ( v 1 ) − T ( v 2 ) = 0
כלומר v 1 − v 2 ∈ ker T v_1 - v_2 \in \ker T v 1 − v 2 ∈ ker T . שני וקטורים שונים שנשלחים לאותו פלט נבדלים בוקטור מהגרעין.
משפט המימדים (Rank-Nullity)
אם T : V → W T: V \to W T : V → W ה"ל ו-V V V ממימד סופי:
dim ( ker T ) + dim ( Im T ) = dim V \dim(\ker T) + \dim(\text{Im } T) = \dim V dim ( ker T ) + dim ( Im T ) = dim V
מינוחים:
dim ( ker T ) \dim(\ker T) dim ( ker T ) = nullity
dim ( Im T ) \dim(\text{Im } T) dim ( Im T ) = rank
אינטואיציה
כל ה"מידע" ב-V V V מתחלק לשני חלקים:
מה שנמחק — הולך לגרעין
מה שנשמר/מופיע בתמונה
אם הרבה וקטורים שונים נשלחים לאותו וקטור, הגרעין גדול והתמונה קטנה. אם T T T חח"ע, הגרעין { 0 } \{0\} { 0 } והתמונה מקבלת את כל הממדים.
קיום ויחידות של ה"ל לפי בסיס
יהיו V , W V, W V , W מ"ו מעל F F F , B = { v 1 , … , v n } B = \{v_1, \ldots, v_n\} B = { v 1 , … , v n } בסיס של V V V , ו-{ w 1 , … , w n } \{w_1, \ldots, w_n\} { w 1 , … , w n } וקטורים ב-W W W .
אז קיימת אחת ויחידה ה"ל T : V → W T: V \to W T : V → W כך ש-T ( v i ) = w i T(v_i) = w_i T ( v i ) = w i לכל 1 ≤ i ≤ n 1 \leq i \leq n 1 ≤ i ≤ n .
אינטואיציה
בסיס הוא קבוצת אבני בניין . ברגע שמחליטים מה קורה לכל אבן בנייה, כל וקטור אחר נקבע מאליו לפי ליניאריות.
בסיס סדור וקואורדינטות
בסיס סדור: בסיס שבו הסדר חשוב:
B = ( v 1 , v 2 , … , v n ) B = (v_1, v_2, \ldots, v_n) B = ( v 1 , v 2 , … , v n )
הסדר משנה כי הקואורדינטות תלויות במיקום של כל וקטור בסיס.
וקטור קואורדינטות: אם v = α 1 v 1 + ⋯ + α n v n v = \alpha_1 v_1 + \cdots + \alpha_n v_n v = α 1 v 1 + ⋯ + α n v n (הצגה יחידה לפי B B B ), אז:
[ v ] B = ( α 1 α 2 ⋮ α n ) [v]_B = \begin{pmatrix} \alpha_1 \\ \alpha_2 \\ \vdots \\ \alpha_n \end{pmatrix} [ v ] B = α 1 α 2 ⋮ α n
דוגמה — מרחב הפולינומים P n P_n P n
P n P_n P n = פולינומים מדרגה ≤ n \leq n ≤ n מעל F F F .
הבסיס הסטנדרטי: ( 1 , x , x 2 , … , x n ) (1, x, x^2, \ldots, x^n) ( 1 , x , x 2 , … , x n ) .
כל פולינום a 0 + a 1 x + ⋯ + a n x n a_0 + a_1 x + \cdots + a_n x^n a 0 + a 1 x + ⋯ + a n x n מזוהה עם וקטור המקדמים:
$
\begin{pmatrix} a_0 \ a_1 \ \vdots \ a_n \end{pmatrix}$$
זה בסיס כי:
פורש: כל פולינום מהמרחב ניתן לכתיבה כצירוף לינארי שלהם
בלתי תלוי לינארית: אם a 0 + a 1 x + ⋯ + a n x n = 0 a_0 + a_1 x + \cdots + a_n x^n = 0 a 0 + a 1 x + ⋯ + a n x n = 0 לכל x x x , אז כל a i = 0 a_i = 0 a i = 0
יש בו n + 1 n+1 n + 1 איברים, לכן dim P n = n + 1 \dim P_n = n + 1 dim P n = n + 1
מטריצה מייצגת של ה"ל
יהי T : V → W T: V \to W T : V → W ה"ל, B = { v 1 , … , v n } B = \{v_1, \ldots, v_n\} B = { v 1 , … , v n } בסיס סדור של V V V , ו-C = { w 1 , … , w m } C = \{w_1, \ldots, w_m\} C = { w 1 , … , w m } בסיס סדור של W W W .
המטריצה המייצגת של T T T ביחס לבסיסים B B B ו-C C C :
[ T ] C B = ( [ T ( v 1 ) ] C ∣ [ T ( v 2 ) ] C ∣ ⋯ ∣ [ T ( v n ) ] C ) ∈ F m × n [T]^B_C = \Big( [T(v_1)]_C \mid [T(v_2)]_C \mid \cdots \mid [T(v_n)]_C \Big) \in F^{m \times n} [ T ] C B = ( [ T ( v 1 ) ] C ∣ [ T ( v 2 ) ] C ∣ ⋯ ∣ [ T ( v n ) ] C ) ∈ F m × n
העמודה ה-i i i היא קואורדינטות T ( v i ) T(v_i) T ( v i ) בבסיס C C C .
סימון
אם T : V → V T: V \to V T : V → V אופרטור לינארי, מסמנים [ T ] B : = [ T ] B B [T]_B := [T]^B_B [ T ] B := [ T ] B B .
משפט (פעולת המטריצה): עבור כל v ∈ V v \in V v ∈ V :
[ T ( v ) ] C = [ T ] C B ⋅ [ v ] B [T(v)]_C = [T]^B_C \cdot [v]_B [ T ( v ) ] C = [ T ] C B ⋅ [ v ] B
דוגמאות
(1) האופרטור האפס O : V → V O: V \to V O : V → V , O ( v ) = 0 O(v) = 0 O ( v ) = 0 לכל v v v :
[ O ] B = ( 0 ⋯ 0 ⋮ ⋮ 0 ⋯ 0 ) [O]_B = \begin{pmatrix} 0 & \cdots & 0 \\ \vdots & & \vdots \\ 0 & \cdots & 0 \end{pmatrix} [ O ] B = 0 ⋮ 0 ⋯ ⋯ 0 ⋮ 0
לכל בסיס B B B .
(2) אופרטור הזהות I : V → V I: V \to V I : V → V , I ( v ) = v I(v) = v I ( v ) = v :
[ I ] B = I n = ( 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋱ ⋮ 0 ⋯ 0 1 ) [I]_B = I_n = \begin{pmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & & \ddots & \vdots \\ 0 & \cdots & 0 & 1 \end{pmatrix} [ I ] B = I n = 1 0 ⋮ 0 0 1 ⋯ ⋯ ⋯ ⋱ 0 0 0 ⋮ 1
לכל בסיס B B B — תמיד מטריצת היחידה.
דוגמה מורחבת — אופרטור הנגזרת על P n P_n P n
T : P n → P n T: P_n \to P_n T : P n → P n , T ( p ) = p ′ T(p) = p' T ( p ) = p ′ .
עם הבסיס הסטנדרטי B = ( 1 , x , x 2 , … , x n ) B = (1, x, x^2, \ldots, x^n) B = ( 1 , x , x 2 , … , x n ) :
T ( 1 ) = 0 , T ( x ) = 1 , T ( x 2 ) = 2 x , … , T ( x n ) = n x n − 1 T(1) = 0, \quad T(x) = 1, \quad T(x^2) = 2x, \quad \ldots, \quad T(x^n) = n x^{n-1} T ( 1 ) = 0 , T ( x ) = 1 , T ( x 2 ) = 2 x , … , T ( x n ) = n x n − 1
ולכן:
[ T ] B = ( 0 1 0 0 ⋯ 0 0 0 2 0 ⋯ 0 0 0 0 3 ⋯ 0 ⋮ ⋱ ⋱ ⋮ 0 0 ⋯ 0 0 n 0 0 ⋯ 0 0 0 ) ∈ F ( n + 1 ) × ( n + 1 ) [T]_B = \begin{pmatrix} 0 & 1 & 0 & 0 & \cdots & 0 \\ 0 & 0 & 2 & 0 & \cdots & 0 \\ 0 & 0 & 0 & 3 & \cdots & 0 \\ \vdots & & & \ddots & \ddots & \vdots \\ 0 & 0 & \cdots & 0 & 0 & n \\ 0 & 0 & \cdots & 0 & 0 & 0 \end{pmatrix} \in F^{(n+1) \times (n+1)} [ T ] B = 0 0 0 ⋮ 0 0 1 0 0 0 0 0 2 0 ⋯ ⋯ 0 0 3 ⋱ 0 0 ⋯ ⋯ ⋯ ⋱ 0 0 0 0 0 ⋮ n 0 ∈ F ( n + 1 ) × ( n + 1 )
עם המספרים 1 , 2 , … , n 1, 2, \ldots, n 1 , 2 , … , n על העל-אלכסון.
פירוט
גודל ( n + 1 ) × ( n + 1 ) (n+1) \times (n+1) ( n + 1 ) × ( n + 1 ) : כי dim P n = n + 1 \dim P_n = n+1 dim P n = n + 1 , והאופרטור הוא P n → P n P_n \to P_n P n → P n .
עמודת אפסים (ראשונה): כי T ( 1 ) = 0 T(1) = 0 T ( 1 ) = 0 .
שורת אפסים (אחרונה): כי הנגזרת לא יכולה לייצר איבר ממעלה n n n .
נקודה פדגוגית — לא מוחקים שורת אפסים!
גם אם יש שורת אפסים, לא מוחקים אותה במטריצה מייצגת. היא חלק מהמימד של מרחב היעד.
זה שונה ממטריצה של מערכת משוואות, שבה שורת אפסים יכולה להיות "משוואה חסרת מידע".
מטריצת מעבר
יהיו B , E B, E B , E בסיסים סדורים של אותו מרחב V V V . מטריצת המעבר מ-B B B ל-E E E :
P E ← B = [ I ] E B = ( [ v 1 ] E ∣ [ v 2 ] E ∣ ⋯ ∣ [ v n ] E ) ∈ F n × n P_{E \leftarrow B} = [I]^B_E = \Big( [v_1]_E \mid [v_2]_E \mid \cdots \mid [v_n]_E \Big) \in F^{n \times n} P E ← B = [ I ] E B = ( [ v 1 ] E ∣ [ v 2 ] E ∣ ⋯ ∣ [ v n ] E ) ∈ F n × n
עמודותיה: וקטורי הבסיס B B B כתובים לפי הבסיס E E E .
החלפת קואורדינטות:
[ v ] E = P E ← B ⋅ [ v ] B [v]_E = P_{E \leftarrow B} \cdot [v]_B [ v ] E = P E ← B ⋅ [ v ] B
אינטואיציה
זו לא העתקה חדשה — זה רק שינוי "משקפיים". אותו וקטור v v v , מסתכלים עליו בעיניים של בסיס אחר.
תכונות מטריצת המעבר
P B ← C , P C ← B ∈ F n × n P_{B \leftarrow C}, P_{C \leftarrow B} \in F^{n \times n} P B ← C , P C ← B ∈ F n × n (ריבועיות)
כל מטריצת מעבר היא הפיכה
( P C ← B ) − 1 = P B ← C (P_{C \leftarrow B})^{-1} = P_{B \leftarrow C} ( P C ← B ) − 1 = P B ← C
שרשור: P C ← B = P C ← D ⋅ P D ← B P_{C \leftarrow B} = P_{C \leftarrow D} \cdot P_{D \leftarrow B} P C ← B = P C ← D ⋅ P D ← B
דרך הבסיס הסטנדרטי E E E : P C ← B = ( P E ← C ) − 1 ⋅ P E ← B P_{C \leftarrow B} = (P_{E \leftarrow C})^{-1} \cdot P_{E \leftarrow B} P C ← B = ( P E ← C ) − 1 ⋅ P E ← B
שינוי בסיס למטריצה מייצגת
אם T : V → V T: V \to V T : V → V אופרטור, B B B ו-E E E בסיסים סדורים, A = [ T ] E A = [T]_E A = [ T ] E , ו-P = P E ← B P = P_{E \leftarrow B} P = P E ← B , אז:
[ T ] B = P − 1 ⋅ A ⋅ P [T]_B = P^{-1} \cdot A \cdot P [ T ] B = P − 1 ⋅ A ⋅ P
פירוט הנוסחה
[ T ( v ) ] B = P − 1 ⋅ A ⋅ P ⋅ [ v ] B [T(v)]_B = P^{-1} \cdot A \cdot P \cdot [v]_B [ T ( v ) ] B = P − 1 ⋅ A ⋅ P ⋅ [ v ] B
[ v ] B [v]_B [ v ] B : הוקטור v v v כתוב לפי B B B
P P P : מעביר קואורדינטות מ-B B B ל-E E E
A A A : מפעיל את ההעתקה לפי E E E
P − 1 P^{-1} P − 1 : מחזיר ל-B B B
אינטואיציה
שינוי בסיס = עוברים לבסיס שבו נוח לעבוד, מפעילים את ההעתקה, וחוזרים לבסיס המקורי.
מטריצות דומות
A , A ′ ∈ M n ( F ) A, A' \in M_n(F) A , A ′ ∈ M n ( F ) נקראות דומות אם קיימת P P P הפיכה כך ש:
A ′ = P − 1 A P A' = P^{-1} A P A ′ = P − 1 A P
המטריצות [ T ] B [T]_B [ T ] B ו-[ T ] C [T]_C [ T ] C של אופרטור באותו מרחב הן דומות — מייצגות את אותו אופרטור בבסיסים שונים.
למה זה חשוב?
דמיון מטריצות הוא מושג מרכזי בהמשך הקורס. לכסון, צורת ז'ורדן וערכים עצמיים כולם מבוססים על מציאת בסיס שבו המטריצה "פשוטה" ככל האפשר.
אינטואיציות לזכור
תקציר
"בסיס הוא קבוצת אבני בניין"
"הגרעין הוא מה שנמחק"
"התמונה היא מה שנשאר"
"שני וקטורים שנשלחים לאותו פלט נבדלים בוקטור מהגרעין"
"שינוי בסיס הוא שינוי משקפיים"
"מטריצות דומות = אותו אופרטור, בסיסים שונים"