python scrapy css抓值

python scrapy css

noway 2024-12-01 15:57:36 ‧ 1141 瀏覽

分享至

您好：
目標
start_urls = ["https://code.tutsplus.com/t/tutorials"]

以下HTML 是用CHROM F12COPY出來的element
其中目前是可以用，以下程式碼抓出

v_author=tut.css("footer > div >div> a::text").extract_first().strip() #OK

但我想試著了解用

#v_author=tut.css("a[aria-label^='Author:']::text").extract_first().strip()
或
#v_author=tut.css("footer > div >div> a.flex z-[1] relative rounded-md::text").extract_first().strip()

但這都抓不到值
請問類似這種情況
1.我要抓或其他標籤內屬性aria-label="Author:" 開頭的，要如何下?
2.class 內 flex z-[1] relative text-grey-700 block，這應該是多個class
要若要以這一串為搜索標準，要如何下?
謝謝

    <div class="flex mt-4 [&amp;>div>a]:!inline-block [&amp;>div>a]:truncate [&amp;>div>a]:max-w-[160px]" xpath="1">
        <a class="flex z-[1] relative rounded-md" aria-label="Author: Jemima Abu"
            href="https://tutsplus.com/authors/jemima-abu">


            <img src="https://cms-assets.tutsplus.com/uploads/users/2722/profiles/21247/profileImage/jemima_3.jpeg"
                class="rounded-md" alt="Jemima Abu" width="32px" height="32px" loading="lazy">


        </a>
        <div class="text-xs md:text-sm flex ml-2 w-max leading-5 items-center">
            <a class="flex z-[1] relative text-grey-700 block" aria-label="Author: Jemima Abu"
                href="https://tutsplus.com/authors/jemima-abu">


                Jemima Abu


            </a>
            <span class="text-grey-500 ml-1 mr-1">•</span>
            <time class="text-grey-500">14 Oct 2024</time>
        </div>


    </div>