fastvideo.pipelines.pipeline_batch_info

Contents

`fastvideo.pipelines.pipeline_batch_info`#

Data structures for functional pipeline processing.

This module defines the dataclasses used to pass state between pipeline components in a functional manner, reducing the need for explicit parameter passing.

Module Contents#

Classes#

`ForwardBatch`	Complete state passed through the pipeline execution.
`PipelineLoggingInfo`	Simple approach using OrderedDict to track stage metrics.
`PreprocessBatch`
`TrainingBatch`

API#

class fastvideo.pipelines.pipeline_batch_info.ForwardBatch[source]#

Complete state passed through the pipeline execution.

This dataclass contains all information needed during the diffusion pipeline execution, allowing methods to update specific components without needing to manage numerous individual parameters.

STA_param: list | None[source]#: None

VSA_sparsity: float[source]#: 0.0

batch_size: int | None[source]#: None

boundary_ratio: float | None[source]#: None

clip_embedding_neg: list[torch.Tensor] | None[source]#: None

clip_embedding_pos: list[torch.Tensor] | None[source]#: None

data_type: str[source]#: None

do_classifier_free_guidance: bool[source]#: False

enable_teacache: bool[source]#: False

eta: float[source]#: 0.0

extra: dict[str, Any][source]#: ‘field(…)’

extra_step_kwargs: dict[str, Any][source]#: ‘field(…)’

fps: list[int] | int | None[source]#: None

generator: torch.Generator | list[torch.Generator] | None[source]#: None

guidance_rescale: float[source]#: 0.0

guidance_scale: float[source]#: 1.0

guidance_scale_2: float | None[source]#: None

height: list[int] | int | None[source]#: None

height_latents: list[int] | int | None[source]#: None

image_embeds: list[torch.Tensor][source]#: ‘field(…)’

image_latent: torch.Tensor | None[source]#: None

image_path: str | None[source]#: None

is_cfg_negative: bool[source]#: False

is_prompt_processed: bool[source]#: False

latents: torch.Tensor | None[source]#: None

logging_info: fastvideo.pipelines.pipeline_batch_info.PipelineLoggingInfo[source]#: ‘field(…)’

mask_search_final_result_neg: list[list] | None[source]#: None

mask_search_final_result_pos: list[list] | None[source]#: None

max_sequence_length: int | None[source]#: None

modules: dict[str, Any][source]#: ‘field(…)’

n_tokens: int | None[source]#: None

negative_attention_mask: list[torch.Tensor] | None[source]#: None

negative_prompt: str | list[str] | None[source]#: None

negative_prompt_embeds: list[torch.Tensor] | None[source]#: None

noise_pred: torch.Tensor | None[source]#: None

num_frames: list[int] | int[source]#: 1

num_frames_round_down: bool[source]#: False

num_inference_steps: int[source]#: 50

num_videos_per_prompt: int[source]#: 1

output: torch.Tensor | None[source]#: None

output_path: str[source]#: ‘outputs/’

output_video_name: str | None[source]#: None

pil_image: torch.Tensor | PIL.Image.Image | None[source]#: None

preprocessed_image: torch.Tensor | None[source]#: None

prompt: str | list[str] | None[source]#: None

prompt_attention_mask: list[torch.Tensor] | None[source]#: None

prompt_embeds: list[torch.Tensor][source]#: ‘field(…)’

prompt_path: str | None[source]#: None

prompt_template: dict[str, Any] | None[source]#: None

raw_latent_shape: torch.Tensor | None[source]#: None

return_frames: bool[source]#: False

return_trajectory_decoded: bool[source]#: False

return_trajectory_latents: bool[source]#: False

save_video: bool[source]#: True

seed: int | None[source]#: None

seeds: list[int] | None[source]#: None

sigmas: list[float] | None[source]#: None

step_index: int | None[source]#: None

teacache_params: fastvideo.configs.sample.teacache.TeaCacheParams | fastvideo.configs.sample.teacache.WanTeaCacheParams | None[source]#: None

timestep: torch.Tensor | float | int | None[source]#: None

timesteps: torch.Tensor | None[source]#: None

trajectory_decoded: list[torch.Tensor] | None[source]#: None

trajectory_latents: torch.Tensor | None[source]#: None

trajectory_timesteps: list[torch.Tensor] | None[source]#: None

width: list[int] | int | None[source]#: None

width_latents: list[int] | int | None[source]#: None

class fastvideo.pipelines.pipeline_batch_info.PipelineLoggingInfo[source]#

Simple approach using OrderedDict to track stage metrics.

Initialization

add_stage_execution_time(stage_name: str, execution_time: float)[source]#: Add execution time for a stage.

add_stage_metric(stage_name: str, metric_name: str, value: Any)[source]#: Add any metric for a stage.

get_execution_order() → list[str][source]#: Get stages in execution order.

get_stage_info(stage_name: str) → dict[str, Any][source]#: Get all info for a specific stage.

get_total_execution_time() → float[source]#: Get total pipeline execution time.

class fastvideo.pipelines.pipeline_batch_info.PreprocessBatch[source]#

Bases: fastvideo.pipelines.pipeline_batch_info.ForwardBatch

video_file_name: list[str]#: ‘field(…)’

video_loader: list[torchcodec.decoders.VideoDecoder] | list[str][source]#: ‘field(…)’

class fastvideo.pipelines.pipeline_batch_info.TrainingBatch[source]#

attn_metadata: fastvideo.attention.AttentionMetadata | None[source]#: None

attn_metadata_vsa: fastvideo.attention.AttentionMetadata | None[source]#: None

conditional_dict: dict[str, Any] | None[source]#: None

current_timestep: int[source]#: 0

current_vsa_sparsity: float[source]#: 0.0

dmd_latent_vis_dict: dict[str, Any][source]#: ‘field(…)’

encoder_attention_mask: torch.Tensor | None[source]#: None

encoder_attention_mask_neg: torch.Tensor | None[source]#: None

encoder_hidden_states: torch.Tensor | None[source]#: None

encoder_hidden_states_neg: torch.Tensor | None[source]#: None

fake_score_latent_vis_dict: dict[str, Any][source]#: ‘field(…)’

fake_score_loss: float[source]#: 0.0

generator_loss: float[source]#: 0.0

grad_norm: float | None[source]#: None

image_embeds: torch.Tensor | None[source]#: None

image_latents: torch.Tensor | None[source]#: None

infos: list[dict[str, Any]] | None[source]#: None

input_kwargs: dict[str, Any] | None[source]#: None

latent_vis_dict: dict[str, Any][source]#: ‘field(…)’

latents: torch.Tensor | None[source]#: None

loss: torch.Tensor | None[source]#: None

mask_lat_size: torch.Tensor | None[source]#: None

noise: torch.Tensor | None[source]#: None

noise_latents: torch.Tensor | None[source]#: None

noisy_model_input: torch.Tensor | None[source]#: None

preprocessed_image: torch.Tensor | None[source]#: None

raw_latent_shape: torch.Tensor | None[source]#: None

sigmas: torch.Tensor | None[source]#: None

timesteps: torch.Tensor | None[source]#: None

total_loss: float | None[source]#: None

trajectory_latents: torch.Tensor | None[source]#: None

trajectory_timesteps: torch.Tensor | None[source]#: None

unconditional_dict: dict[str, Any] | None[source]#: None