הבלוג של גרי רשף

22/12/2011

FileTable ב-SQL Server 2012

Filed under: Uncategorized — גרי רשף @ 20:54

הקדמה רקע קצרה: יתכן מצב בו נשקול אפשרות לשלב קבצים בבסיס הנתונים (הכוונה לקבצי טקסט, Office, גרפיקה, וידאו, קול וכו'; ולא לקבצי mdf..). תסריטים אפשריים:
1. למשאבי אנוש מגיעים קבצי קורות חיים של עובדים ורוצים לשמור אותם בבסיס הנתונים (במקום לאתר את המועמד בדטבייס ולחפש במיילים או במחיצות את קובץ ה-Word שהוא שלח).
2. עבדתי פעם בחברה שייצרה מוצר צריכה נפוץ, חנויות ששמו את המוצרים של החברה במקום בולט זכו לתגמול, וסוכני המכירות היו עורכים ביקורות – מצלמים ושומרים על קשר אישי. התמונות נשמרו במחיצה עם שם שכלל את מספר הלקוח, אבל היה נוח יותר לו ניתן לשלב את הקבצים או לפחות את מיקומם בבסיס הנתונים.
3. הארגון רוצה לנהל מערכת מעקב אחר מסמכים המבוססת על SQL Server: אילו מסמכים יש, גרסאות, מאפיינים וכו'; שוב- מבלי שהקבצים יהיו קיימים באופן עצמאי ובלתי תלוי במערכת המידע.
עד גרסת 2008 ניתן היה לשמור קבצים בטבלאות בעמודות BLOB כמתואר בפוסט הזה. הפתרון מאוד בעייתי משתי סיבות עיקריות:
1. הדבר גורם לניפוח קבצי הדטבייס בקבצים ששמורים בהם כמידע בינארי, בשעה שאין למידע הזה שום שימוש כמידע לצורך פילטור או חישוב וכו' (אפשר כמובן לשמור בטבלה רק את מיקום הקובץ בדיסק אבל אז שתי המערכות אינן מסונכרנות בהכרח).
2. הטיפול בקבצים מסורבל- במקום להיכנס עם ה-File Explorer למחיצה ושם לטפל בקבצים- יש לכתוב פרוצדורה שתשמור ותשלוף אותם על פי הצורך, וליצור ממשק משתמש משל עצמנו.
מגרסת 2008 התווספה אופציית ה-FileStream: כעת יש אפשרות לשמור את הקבצים החיצוניים כך שאינם חלק מקבצי ה-mdf אלא נשמרים באופן עצמאי על הדיסק כ-FileStream, כלומר- כקובצים בינאריים שמערכת ה-SQL Server מתייחסת אליהם כאל אוסף של ביטים ובייטים מבלי להתעניין אם מדובר בקובץ PDF או Exe וכו'.
זה פותר את בעייה מספר 1 הנ"ל (ניפוח הקבצים), אך לא את מספר 2- עדיין יש לשמור ולשלוף בעזרת פקודות SQL, וזה אומר שצריך ליצור ממשק מתאים שיבצע את זה בכל פעם שנרצה לגשת לקבצים.
החל מגרסת SQL Server 2012 גם בעייה מספר 2 באה על פתרונה: כעת ניתן לטפל בקבצים דרך סייר הקבצים (File Explorer) – להכניס, למחוק, לשנות, לפתוח, לשמור, ליצור מחיצות משנה, להעביר וכו'; וכל זה מעדכן אוטומטית את הטבלה הרלוונטית. באופן דומה ניתן בעזרת פעולות DML להעתיק ולהעביר קבצים, ליצור ולמחוק מחיצות, לעדכן מאפייני קבצים (Archive, Read Only..) וכו', וכל קובץ ותת-מחיצה מתחת למחיצה שהגדרנו לטבלה קיימים סינכרונית ב-File System ובטבלה עצמה.
אם לדייק- נוכל לפגוש את הקבצים בצורה נוספת- יצירת הטבלה עם ה-FileStream יוצרת מחיצה במקום שהגדרנו שכוללת אובייקטים שונים של המערכת וקבצים בינאריים שמייצגים את הקבצים ששמרנו – ואיתם איננו אמורים להתעסק (כשם שאיננו מתעסקים ישירות עם קבצי ה-mdf אלא עם הטבלאות והפרוצדורות דרך ה-SSMS), אלא פונים למחיצה אחרת שכתובתה אינה c:\MyDir\.. כמקובל אלא משהו בסגנון של ..\MyServer\mssqlserver\MyFileTableDir\MyFileTableDirctory\\.

דיבורים, דיבורים, אבל מה עם קצת קוד?
קודם כל נקנפג את המערכת באופן חד פעמי לשימוש ב-FileStream:
דרך התפריט ה-Programs:

=> Microsoft SQL Server .. => Configuration Tools => פותחים את ה-SQL Server Configuration Manager.

בצד שמאל של הכלי שנפתח בוחרים ב-SQL Server Services, ובצד ימין – קליק ימני על ה-Service הראשי של ה-Instance הרלוונטי (בדרך כלל – SQL Server (MSSQLSERVER)).
בחלונית שנפתחת ניגשים ללשונית FileStream, מסמנים את ה-CheckBoxes הרלוונטיים, מאשרים וסוגרים.

clip_image002

ב-SSMS יש לאפשר את השימוש בכלי כך:

Exec SP_Configure Filestream_Access_Level, 2;
Reconfigure;
Go

clip_image004

נעבור לדטבייס שנועד לבדיקות ונסיונות או ניצור אחד כזה על ידי פקודת Create Database MyDB (לא ניתן להשתמש ב-tempdb), ומכיוון שה-FileStream יוצר קבצים חדשים שהם חלק מהדטבייס – יש להגדיר FileGroup מתאים עבורם, מחיצה פיזית, ושם לוגי בו נפנה אליה:

Alter Database MyDB
      Add FileGroup MyFileTableFG Contains FileStream;
Go

Alter Database MyDB
      Add File(Name='MyFileTableDirName',
      FileName='C:\MyFileTableFile')
      To FileGroup MyFileTableFG;
Go

Alter Database MyDB
      Set FileStream(Non_Transacted_Access=Full,
      Directory_Name='MyFileTableDir');
Go

ולבסוף ניצור טבלה שתהיה מסונכרנת עם המחיצה הנ"ל (המחיצה הפיזית C:\MyFileTableFile המיוצגת לוגית על ידי MyFileTableDir):

Use MyDB;
Go

Create Table MyTable As FileTable
       With(FileTable_Directory='MyFileTableDirectory');
Go

Select * From MyTable Order By name;
Go

clip_image006

כעת עוד אין כלום במחיצה ולכן הטבלה ריקה, אבל כבר אפשר לשים לב שב-SSMS תחת מחיצת Tables מופיעה מחיצה חדשה בשם FileTables ובה הטבלה שנוצרה על פי הפקודה הנ"ל למרות שלא ציינו את שמות העמודות (המבנה שלה קשיח- ולא ניתן לשנותו).

בתור התחלה נוסיף פנימה כמה קבצים.

נפתח את המחיצה הלוגית כך: קליק ימני על הטבלה, ובתפריט שנפתח לבחור ב-Explore File Table Directory, ונקבל את ה-File Explorer המוכר במחיצה

\\Gerireshef\mssqlserver\MyFileTableDir\MyFileTableDirectory

(המחשב שלי נקרא GeriReshef, ולכל אחד יופיע שם המחשב וה-Instance שלו).

ומי שמתעצל לחפש קבצים מתאימים אצלו במחשב יכול להוריד את הקובץ המכווץ הזה,

לפתוח אותו במחיצה שנפתחה,

ליצור בתוכה מחיצת משנה בשם Gibuy,

להעביר לשם את קובץ ה-Rar(כדאי כבר להתרגל לרפרש את התצוגה לאחר כל פעולה על ידי F5),

clip_image008

ואפשר כך (למרות שלא ניתן "להיכנס" למחיצה על ידי פקודת CD):

clip_image009

וגם כך:

Exec XP_CmdShell 'Dir \\Gerireshef\mssqlserver\MyFileTableDir\MyFileTableDirectory';
Go

clip_image010

ולבדוק שוב את הטבלה:

Select * From MyTable Order By name;
Go

clip_image012

כבר אפשר לשים לב שהטבלה כוללת יחסי אב-בן (או- יחס של אחת לרבים 1:N עם עצמה), מה שמבטיח פוסט עתידי עם קוד רקורסיבי המאפשר לחקור את מבנה עץ מחיצות המשנה שמתחת למחיצה הלוגית.

סוג הנתון של העמודות האלו (path_locator, parent_path_locator) הוא Hierarchy_id וגם בזה עוד נלכלך את הידיים..

ננסה לבצע כמה פעולות עריכה באמצעות קוד, למשל אשכפל את עצמי (כלומר- את התמונה שלי):

INSERT
INTO   MyTable(file_stream,name)
Select ,
       'MyJPG2.jpeg';

clip_image013

קצת ארוך- זה ה-FileStream של התמונה שלי כפי שהעתקתי מעמודה file_stream מהטבלה, ולאחר ריפרוש F5 נראה את הקובץ במחיצה. אפשר לחסוך את זה על ידי Select מפולטר מהטבלה, אבל רציתי להמחיש שמעתה ניתן להעביר קבצים גם כך..

כעת ניצור מחיצה חדשה:

Insert
Into   MyTable(name,is_directory)
Select 'MySubDir',
       1;

clip_image014

clip_image016

ונעביר אליה את הקובץ החדש שיצרנו על ידי Update למיקומו:

Update MyTable
Set    path_locator=(Select path_locator.ToString() From MyTable Where name='MySubDir')+Stuff(path_locator.ToString(),1,1,'')
Where  name='MyJPG2.jpeg';

clip_image018

clip_image020

כאן צריך להתחיל לתרגל את ההיכרות עם ה-HierarchyID והפונקציות שלו (נדמה לי שאנשי הדוט-נט קוראים לזה מתודות..)- ToString או Cast As Varchar מציגה את הערכים כשרשור של העץ מהשורש עד אליהם:

Select  name,
        path_locator.ToString() [path_locator],
        Cast(parent_path_locator As Varchar(Max)) [parent_path_locator]
From    MyTable;

clip_image022

השתמשתי פעם ב-ToString ופעם ב-Cast As Varchar לצורך ההמחשה.

אפשר לראות שה-path_locator של שני הקבצים במחיצות המשנה מורכב מזה של המחיצה ומזה שלו; וכך העברנו את הקובץ מהמחיצה הראשית למשנית על ידי בניית ה-path_locator שלו.

מחיקה של קובץ תתבצע על ידי פקודת Delete, אך מחיקת מחיצה יכולה להתבצע בפעולת Delete רק אם אין לה תוכן, אחרת- יש לבצע קודם Delete לתוכן (אנחנו "מריחים" רקורסיה במקרה שרוצים למחוק ענף שלם מהעץ).

אנחנו ננסה למחוק בדרך מתחכמת- מכיוון שמדובר בטבלה היא אמורה לאפשר טרנזקציות. למשל-

Begin Tran
Delete From MyTable Where name='MyJPG.jpeg';
--RollBack;

(לא לבצע RollBack בשלב זה אלא רק בסוף)

ב-Query חדש שנפתח ננסה להריץ

Select * From MyTable;
Go

והשאילתה תתקע בגלל נעילה על הטבלה.

נריץ עם Hint של NoLock

Select * From MyTable (NoLock);
Go

ולא נראה את הקובץ בטבלה.

ניגש למחיצה הלוגית ב-File Explorer, נרפרש, והוא איננו. כלומר- הכלי מציג מידע UnCommited. ראו הוזהרתם!

הסקרנים מוזמנים לחטט מעט בקרביים של המערכת ולהיכנס למחיצה הפיזית C:\MyFileTableFile שיצרנו, לחטט בתתי המחיצות ולחפש היכן שמורים הקבצים ובאיזה אופן (בכניסה יש לקבל אישור חד פעמי מכיוון שמדובר במחיצת מערכת).

במקרה זה נמצא שני קבצי File Stream בגודל 5kb של שני קבצי ה-Jpeg. הווה אומר- הקובץ עדיין קיים..

לסיום- לא לשכוח לבצע Rollback.

גיבוי- בדקתי והגיבוי מתבצע גם על הקבצים. חשוב לשים לב לכך- מצד אחד יתרון בכך שתפסנו שתי ציפורים ביד אחת ולא צריך לסמוך על החבר'ה מה-System, אבל מצד שני קבצי הגיבוי עלולים להתנפח וכבר עדיף להפיל את התיק חזרה על ה-System..

לסיכום: מעניין, סוגר את הפינה של ממשק המשתמש שנותרה פתוחה עד כה, ויש עוד הרבה מה לבדוק ובעיקר לנסות- חמישה קבצים צנועים בגודלם אינם מערכת אמיתית של אלפי קבצים גדולים בעץ מסועף של מחיצות וריבוי משתמשים.

אני מקווה עוד לחזור ולהתמודד עם בעיות הרקורסיה שהכלי מציב בפנינו.

מודעות פרסומת

6 תגובות »

  1. […] שינויים וכו'; ועל כך כתב לאחרונה אסף אביב. השימוש ב-FileTable החל מגרסת 2012 מתבסס על שימוש ב-HierarchyID, וכפי שציינתי- […]

    פינגבאק של ישום היררכיה (עץ) בעזרת מספרים ראשוניים - גרי רשף — 17/01/2012 @ 21:22

  2. סבבה מה שאתה מעלה פה זה מצויין אינפורמטיבי ובטוח ייחסוך לאנשים זמן, רק הוספתי את הערתי בנוגע לסיכונים הכרוכים, ולכך שאם אפשר בכלל מלהמנע מלשמור קבצים בתוך ה SQL מה טוב.

    תגובה של פלג — 24/12/2011 @ 14:05

  3. 1)xp_cmdshell אם כל פרצות האבטחה, מה גם שאני מניח שאתה מריץ פה את הפעולה עם הרשאות ADMIN אז בכלל סיבה למסיבה.
    החולשה היא בשורה :
    Exec XP_CmdShell 'Dir \\Gerireshef\mssqlserver\MyFileTableDir\MyFileTableDirectory';
    2)ב NET אם אני זוכר נכון עושים את זה עם אובייקטים שלא מצריך שימוש ב xp_cmdshell, מה שמקטין את הסיכון, כככה שעדיף לכתוב CLR למען השקט הנפשי:)

    תגובה של פלג — 23/12/2011 @ 13:08

    • 1. השתמשתי ב-XP_CmdShell לבצע Dir למחיצה. זה לא חלק הכרחי מהטכנולוגיה וזה רק נועד להמחיש איך זה נראה.

      2. אינני יודע איך עושים זאת עם clr (ניהול סינכרוני של קבצים ב-File System וב-File Table), ובטח ובטח שלא עם אוראקל. הראיתי איך עושים זאת עם כלים Built In של SQL Server 2012.

      תגובה של גרי רשף — 23/12/2011 @ 13:29

  4. זה NICE שיש את זה, אבל לא נכון להשתמש באופציה מסיבות של אבטחת מידע, עומס על השרת וכדומה(עם כל הכבוד זה לא התפקיד של ה SQL לעשות את זה).

    תגובה של פלג — 22/12/2011 @ 23:55

    • נכון- אין בכוונתי להתחיל לנהל את הקבצים שלי (מוזיקה, תמונות מהטיול, וידאו מהיום הולדת, מצגות פאוארפוינט, סקריפטים של SQL) דרך FileTable.
      יחד עם זאת- אם יום אחד יקראו לי לדגל ויתנו לי משימה- לא אצטרך להמציא את הגלגל – הוא כבר מומצא.

      אגב- מה בעיית אבטחת המידע?

      תגובה של גרי רשף — 23/12/2011 @ 10:20


RSS feed for comments on this post. TrackBack URI

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת / לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת / לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת / לשנות )

תמונת גוגל פלוס

אתה מגיב באמצעות חשבון Google+ שלך. לצאת מהמערכת / לשנות )

מתחבר ל-%s

יצירה של אתר חינמי או בלוג ב־WordPress.com.

%d בלוגרים אהבו את זה: